Задание для самопроверки 7.1 20 страница
Подготовка заданий для личностных тестов
Первый шаг заключается в том, чтобы решить, в каком виде вы хотите получить ответы на ваши вопросы от респондентов. Существует несколько наиболее распространенных форматов. Тест может представлять утверждения, с которыми люди соглашаются, по отношению к которым они нейтральны, или неуверены, или несогласны, например: «Ночью я не могу уснуть, переживая события дня». Вы можете также, подумав, добавить: «совершенно согласен», «совершенно не согласен», однако не используйте больше семи категорий ответа. Если вы применяете такой тип шкалы, всегда используйте в опроснике такие слова, как «согласен/?/не-
28 - 989
согласен», а не просто цифры. Если используются меньше, чем три категории, могут возникнуть статистические проблемы. При таком типе заданий попытайтесь выдержать нечетное число выборов, поскольку это гарантирует наличие центрального нейтрального ответа, который нравится тестируемым. С другой стороны, тест может содержать несколько возможных вариантов ответа, например: «На прошлой неделе мои тревоги не давали мне возможности сразу уснуть: (а) ни одного дня, (б) один или два дня, (в) три или четыре дня, (г) пять или более дней».
Старайтесь писать утверждения так, чтобы они были четкими, недвусмысленными и требовали как можно меньше самоанализа. Всегда, когда возможно, вы должны обращаться к поведению, а не к чувствам, как это показано во втором примере предыдущего абзаца.
Обеспечьте, чтобы в каждом пункте был задан только один вопрос. Например, не используйте утверждения такого типа, как: «Временами я чувствовал себя подавленным и пытался совершить самоубийство», поскольку крайне депрессивные люди, которые (совсем) не помышляют о попытке самоубийства, не согласятся с этим утверждением, последнее, вероятно, не то, что предполагается получить.
Старайтесь избегать утверждений, сформулированных в отрицательной форме, таких, как: «Мне не нравятся студенты»: «да/?/нет», поскольку выбор ответа «нет» требует от испытуемого интерпретации двойного отрицания.
Старайтесь избегать вопросов, касающихся частоты и количества, вместо этого обращайтесь не к общим вариантам поведения, а к конкретным. Вместо того чтобы спрашивать: «Вы много читаете?», задавайте вопрос: «Сколько книг вы прочитали ради удовольствия в прошлом месяце?» или еще лучше вопрос: «Перечислите книги, которые вы прочитали ради удовольствия в прошлом месяце» (последний может уменьшить социально желательные ответы).
Убедитесь, что ни одно из слов не допускает двойного толкования. Например, в один личностный опросник был включен вопрос: «Получаете ли вы удовольствие от веселых вечеринок?», хотя слово «веселый» («gay») по-английски может означать индивидуума с гомосексуальной ориентацией.
Попытайтесь добиться того, чтобы около 50% заданий по каждому аспекту опросника были построены таким образом, чтобы
ответ «да/совершенно-'Согласен» соответствовал высокой оценке по черте, а другие 50% соответствовали бы низкой оценке по черте. Например, если на утверждение «Обычно я засыпаю ночью сразу же, как только выключается свет» следует ответ: «Совершенно не согласен», это оценивается как указание на тревожность.
Если вы должны спросить о чем-то социально нежелательном, рассмотрите возможность формулировки утверждения как бы с точки зрения другого человека, например: «Некоторые люди могут описывать меня как скупого», а не «вы скупой?».
И наконец, целесообразно иметь такой текст инструкции, что-.бы она призывала респондентов давать первый ответ, который естественным образом приходит в голову, а не искать скрытые значения.
Общие принцип анализа заданий
Закончив набросок теста, необходимо обеспечить, чтобы все задания измеряли один и тот же конструкт, прежде чем проводить проверку надежности и валидности теста. Чтобы сделать это, тест следует предъявить большой выборке людей (п > 200), сходных по своим характеристикам с индивидуумами, которые будут в конечном счете тестироваться при помощи этого теста. Например, если тест будет использоваться для отбора окончивших обучение соискателей в определенную организацию, было бы целесообразно испытать этот тест на студентах, а не на 16-летних школьниках общеобразовательной школы (из-за разной академической подготовки) или пенсионерах (из-за различия в возрасте). Ответы затем обрабатываются, и для каждого индивидуума вычисляется общий балл.
Следующая стадия заключается в том, чтобы проанализировать средние показатели и стандартные отклонения по каждому из заданий. В тесте способностей (где правильный ответ вознаграждается одним баллом, а за неправильный не дают ничего) средняя оценка указывает на степень трудности каждого задания. Средний показатель 0,95 будет означать, что 95% выборки дали правильные ответы на задания. В случае личностных тестов средняя оценка показывает степень, с которой индивидуумы склонны соглашаться или не соглашаться с утверждениями. В соответ-
ствии с общим эмпирическим правилом было бы нежелательно иметь слишком много очень легких или очень трудных заданий в тесте. Таким образом, если более чем 10% заданий имеют средние показатели выше 0,8 или ниже 0,2, будет резонным обдумать возможность удаления некоторых заданий.
Задание для самопроверки 18.1
Почему нецелесообразно иметь слишком много очень легких или очень трудных заданий в тесте?
Величина стандартного отклонения по каждому заданию показывает размах индивидуальных различий, обнаруженных среди ответов испытуемых на это задание. Например, если задание имеет стандартное отклонение, равное 0, значит, все ответили одним и тем же образом и, следовательно, оно явно не фиксирует индивидуальные различия любого рода и должно быть удалено из шкалы. (Когда задания обрабатываются при помощи дихотомической шкалы, такой, как «правильно/неправильно», стандартное отклонение прямо связано со средним значением, что читатели, изучавшие биномиальную теорему, могли бы подтвердить самостоятельно. Этот этап вычисления должен быть в таких случаях пропущен.)
Хотя проверка средних и стандартных отклонений оценок — необходимый первый шаг, она не может обнаружить, какие вопросы в тесте имеют плохое содержание. Например, представим себе, что одно задание в личностном тесте использовало язык, который оказался слишком трудным для понимания испытуемыми, побуждая всех их просто угадывать ответ. На другое задание могла отрицательно влиять «социальная желательность». Мы приведем четыре метода анализа задания для выявления тех из них, которые по той или иной причине просто не измеряют то же самое, что измеряют другие задания теста.
При использовании любого из описанных ниже четырех методов элиминации заданий из теста важно стараться обеспечить, чтобы тест сохранял приблизительно равное число заданий по каждому из его аспектов (как описано выше). Предположим, например, что учитель начал с подготовки пяти заданий по каждому из семи видов математических действий: письменному делению в столбик, письменному умножению в столбик, геометрии/тригонометрии, решению систем уравнений, нахождению корней квадратных из уравнений, дифференцированию и интегрированию. После
этого анализ заданий позволит исключить из 35 заданий слишком легкие, слишком трудные или задания, которые просто не работают, но было бы явной неудачей, если бы анализ привел к исключению всех заданий на письменное деление в столбик и всех заданий на умножение в столбик, поскольку учитель считает, что это два важных компонента математических достижений учащихся. Анализ заданий — это искусство в такой же степени, как и наука, и при удалении заданий важно гарантировать, что по каждому из аспектов останется приблизительно равное их число.
Конструирование тестов по критериальному принципу
Предположим, что нас попросили сконструировать тест для отбора авиационных штурманов. Задача состоит в том, чтобы разработать тест, по общему показателю которого можно было бы предсказать окончательные оценки штурманов после курса обучения и который, следовательно, мог бы быть использован для выявления соискателей с прогнозом плохой успеваемости. Не имея четкого представления о том, какие характеристики личности и способностей могут соответствовать такому применению, мы можем собрать большой опросник, состоящий из 600 заданий, измеряющих, как мы надеемся, все основные способности и личностные черты, которые можно оценить. Но какие из них в действительности предсказывают успешность работы штурмана?
Представим себе, что предварительный вариант шкалы предъявили нескольким сотням стажеров. Наиболее очевидный способ выделения хороших (т.е. прогностичных) заданий теста состоит в том, чтобы валидизировать каждое задание непосредственно по отношению к некоторому критерию. Например, предположим, что в конце обучения каждый стажер-штурман получает отметку от О до 100, указывающую на общий уровень успешности в обучении штурманскому делу. Конечно, процесс анализа заданий будет просто включать корреляции оценок стажеров по каждому из заданий теста с их оценками, полученными в курсе обучения, т.е. с критерием успешности обучения. Задания, имеющие значимые корреляции, могут рассматриваться как способные предсказать этот критерий, а те, которые не в состоянии это сделать, будут удалены из теста.
Эта процедура, известная как критериальный принцип, была использована для конструирования нескольких хорошо известных шкал, включая Миннесотский многофакторный личностный опросник (MMPI и MMPI-2, Hathaway, McKinley, 1967; Graham, 1990) и Калифорнийский психологический опросник (Gough, 1975), шкалы которого могут предположительно выделять различные клинические группы. Не используйте этот метод анализа задания. Как напоминает нам Нанелли (Nunnally, 1978), он имеет несколько значительных недостатков.
Во-первых, существует высокая вероятность того, что он продуцирует шкалы, имеющие очень низкую надежность, т.е. шкалы, задания которых измеряют разные характеристики. Например, предположим, что успех в обучении штурманскому делу зависит от математических способностей, способностей к механике, пространственных способностей, низкого нейротицизма и экстраверсии. Если бы критериальный принцип был применен к большой выборке заданий, он привел бы к созданию шкалы, которая измеряла бы смесь всех этих характеристик. Во-вторых, при отборе заданий редко можно выделить для использования единственный критерий. Например, рассмотрим мою должность, которая включает чтение лекций по индивидуальным различиям и психодиагностике, исследовательскую работу, написание и редактирование книг, написание исследовательских статей, ведение практических занятий и семинаров, администрирование (например, планирование курсов), проверку курсовых и экзаменационных работ, координацию некоторых видов деятельности лаборатории, руководство аспирантами и множество других видов деятельности. По какому принципу следует выбрать ту из них, которая может служить критерием успешности моей профессиональной деятельности? Если их каким-нибудь образом усреднить, то сколько научных работ или сколько программ по учебным курсам будут эквивалентны одной книге? Если используется один критерий, то будет выделен один специфический набор прогностических заданий, если выбран другой критерий, есть вероятность, что выделится совершенно другая выборка заданий. Третья позиция в несколько большей степени связана со статистикой. Для того чтобы отобрать «лучшее» задание по критериальному принципу, ответы на определенные задания коррелируют с критериями. Если тест состоит приблизительно из 400 заданий (как MMPI), тогда вычисляется 400 корреляций. Не вникая в детали, укажем: если вычисляется большое число корре-
ляций, мы должны ожидать, что несколько корреляций будут заметно выше, чем их подлинные (популяционные) значения. Другими словами, некоторые задания, отобранные нами с помощью этой процедуры, вряд ли будут работать на других группах соискателей. Наконец, эта процедура не дает нам реального понимания того, почему работает тест, — она совершенно лишена теоретических оснований. Без понимания того, какие психологические конструкты измеряются с помощью «полезных» заданий, невозможно сказать, будет ли этот тест полезен при других случаях применения (например, при отборе пилотов или авиадиспетчеров), и становится очень сложным «наладить» тест, если он внезапно прекращает предсказывать успешность. По всем этим причинам не следует руководствоваться критериальным принципом.
Конструирование тестов с помощью факторного анализа заданий
Одни психологи, например, Кэттелл, отстаивают целесообразность использования факторного анализа при конструировании тестов, а другие (например, Nunnally, 1978) наряду с этим выделяют некоторые проблемы, возникающие в связи с этим подходом. В соответствии с ним корреляции между полученными оценками по каждому заданию подвергаются факторному анализу, и фактор (или факторы) идентифицируется на основе факторных весов, как описано в главах 14 и 15. Объединяя вместе набор заданий для измерения одного определенного конструкта, мы, разумеется, надеемся, что появится только один фактор и что все переменные будут иметь по нему большие нагрузки. На практике может выделиться больше чем один фактор, и некоторые переменные могут не иметь нагрузок выше 0,4 по любому фактору. Этот метод конструирования шкал просто предусматривает выделение и сохранение тех заданий, которые имеют существенные нарузки по главному фактору (факторам).
При проведении анализа заданий любым методом важно контролировать, чтобы по каждому аспекту теста элиминировалось примерно равное число заданий. Как покажет следующий пример, анализ заданий — это в такой же степени искусство, как и наука. Представим себе, что математический тест из 35 заданий, описанный выше, был подвергнут факторному анализу и выделился только
один фактор. Предположим также, что анализ показал, что три из пяти заданий, измеряющих письменное деление в столбик, имели нагрузки выше 0,4, так же как три из пяти заданий по каждой из следующих тем: умножение в столбик, геометрия/тригонометрия, решение систем уравнений и нахождение квадратных корней из уравнений. Однако представим теперь, что только одно из заданий на дифференцирование и все пять заданий на интегрирование имели нагрузки выше 0,4. Слепое применение критерия, предусматривающего сохранение заданий с «факторными нагрузками выше 0,4», приведет к созданию теста с различным числом заданий по каждой теме. Было бы целесообразнее проверить, нет ли среди заданий на дифференцирование таких, которые имели бы факторные нагрузки лишь ненамного ниже, чем 0,4, и, если таковые имеются, включить два из них в тест и изъять два задания на интегрирование с самыми низкими нагрузками. Этот прием обеспечит тест с 21 заданием, имеющим равное число заданий по каждой теме.
После этого необходимо будет провести эксперименты для проверки того, что эти задания действительно измеряют черту, которую предполагается измерить. Другими словами, должна быть установлена их валидность, как обсуждается в главе 13.
Проблемы возникают при разработке шкал способностей, которые предназначаются для использования с очень жесткими временными лимитами. Поскольку некоторые соискатели могут и не пройти тест до конца, очень сложно установить, почему это произошло: потому, что задания трудны, или потому, что человек не успел, т.е. степень трудности смешивается со скоростью ответов соискателей. На стадии разработки лучше предъявлять тест без ограничения времени и устанавливать временные лимиты лишь при подготовке окончательного варианта.
Конструирование тестов
с помощью теории сложности заданий
Предположим, что теория сложности заданий применяется к набору заданий теста, как описано в главе 16. Используемая программа будет выбирать параметры задания, которые лучше всего характеризуют, каким образом вероятность правильного ответа на определенное задание зависит от уровня способностей индивиду-
ума, измеряемых заданиями теста. Что если одно задание измеряет нечто, очень отличающееся от того, что измеряют другие задания? Например, предположим, что 24 задания оценивают способности в области механики, в то время как одно измеряет словарный запас (легкое задание, написанное таким вычурным языком, что вряд ли кто-либо понимает, чего от него хотят). На что могут быть похожи параметры задания такого типа?
Вероятность «преодоления» словарного задания не будет, скорее всего, существенно зависеть от уровня способностей человека в области механики. В конце концов мы знаем, что существует два совершенно отличных фактора способностей. Следовательно, представляется вероятным, что ХКЗ будет совершенно плоской, почти горизонтальной. Это имеет место в случае, когда задание имеет низкий уровень дискриминации. Таким образом, если при изучении характеристических кривых находятся задания такого типа, может быть, стоит проверить содержание задания. Стоит также проверить, насколько полно одна из моделей, имеющихся в теории сложности заданий, соответствует конкретному заданию. Если задание имеет высокую «остаточную дисперсию» (т.е. вариативность, которую нельзя объяснить тремя параметрами задания), это нередко дает основание полагать, что данное задание измеряет что-то весьма отличное от других и что следует рассмотреть возможность его изъятия из шкалы, хотя процедура изъятия заданий, которые не соответствуют модели, в определенной степени дискуссионна: некоторые будут утверждать, что вместо этого следует использовать более утонченную модель теории сложности заданий. Хемблтон и Сваминатан (Hambleton, Swaminathan, 1985) представляют весьма детальное обсуждение этих проблем.
Однако теория сложности заданий допускает, что набор заданий измеряет один определенный конструкт, и поэтому обычно на практике, прежде чем начать требующий много времени анализ, основанный на теории заданий, проводят быстрый факторный анализ, чтобы проверить, действительно ли выявляется только один фактор. Кажется целесообразным на этой стадии изъять «инородные» (т.е. имеющие низкие нагрузки) задания. Если теорию сложности заданий применять по отношению к набору заданий, измеряющих несколько различных факторов, то целостная процедура распадется на части, поскольку ни одно из них не соответствует модели достаточно хорошо, а оценки параметров могут выглядеть крайне странно, если компьютерная программа вообще
сможет выдать решение. Таким образом, если решено выбирать задания с использованием теории заданий и весь анализ продвигается плохо, может быть, стоит проверить, являются ли задания истинно монометричными. Основными недостатками теории сложности заданий являются, конечно, ее теоретическая сложность и необходимость использования специализировнных компьютерных программ.
Классический анализ заданий
Мы оставили наиболее простую методику анализа заданий напоследок. Вспомните, что высокая надежность обычно рассматривается как великолепная характеристика теста, следовательно, кажется целесообразным попытаться оценить степень, с которой каждое задание теста коррелирует с подлинными оценками индивидуумов, т.е. с теми оценками, которые, как вы помните, каждый индивидуум мог бы получить, если бы ему предъявили все задания, которые потенциально могли бы быть созданы для измерения данной области. Если мы тем или иным способом выделим задания, каждое из которых имеет существенные корреляции с подлинной оценкой, при сложении оценок индивидуумов по этим заданиям общие показатели по тесту обязаны дать существенную корреляцию с подлинной оценкой. Это, разумеется, другой способ утверждать, что тест имеет высокую внутреннюю согласованность или надежность. Таким образом, если можно выделить задания, которые обнаруживают существенные корреляции с подлинной оценкой, можно также выбрать те задания, которые будут обеспечивать высоконадежный тест.
Проблема состоит в том, что мы никогда не можем получить подлинные оценки индивидуумов. Однако существует один фрагмент данных, который, как может быть показано, приближается к ним, а именно общая оценка индивидуумов по всем заданиям теста. Поэтому классический анализ заданий просто предусматривает корреляции общего показателя по тесту с оценками по каждому из отдельных заданий. Рассмотрим, например, данные из табл. 18.1, которые представляют ответы шести испытуемых на тест из пяти заданий (где правильный ответ оценивался 1, а неправильный 0) и общую оценку каждого испытуемого по этому тесту.
Таблица 18.1
Гипотетические данные для анализа заданий
Задание 1 | Задание 2 | Задание | Задание 4 | Задание 5' | Общая оценка | |
Испытуемый 1 | ||||||
Испытуемый 2 | ||||||
Испытуемый 3 | ||||||
Испытуемый 4 | ||||||
Испытуемый 5 | ||||||
Испытуемый 6 | ||||||
г с общей | 0,63 | 0,32 | -0,20 | 0,95 | 0,63 | |
оценкой | ||||||
г с общей | 0,11 | 0,22 | -0,48 | 0,87 | 0,50 | |
оценкой/коррек- | ||||||
тированный |
Строка «г с общей оценкой» — это просто корреляции ответов на каждое задание теста с общей оценкой по тесту. Чтобы понять, как они вычислялись, можете проверить одну или две из них.
Корреляции между каждым заданием и общей оценкой настолько тесны, насколько мы можем приблизиться к оценке корреляции между каждым заданием и подлинной оценкой, следовательно, кажется разумным изъять те задания, которые имеют небольшие корреляции с общей оценкой, еще раз тщательно проверив, что каждый аспект черты измеряется определенным заданием, и убедившись, что оставшиеся задания приблизительно поровну распределены по каждому из аспектов. Поэтому, хотя процедура анализа заданий включает удаление тех из них, которые имеют низкую корреляцию с общей оценкой на каждой стадии, это далеко не всегда будет самое низкокоррелирующее задание.
Существует одна явная проблема, возникающая при корреляции заданий с общей оценкой. Она состоит в том, что каждое задание вносит свой вклад в общую оценку, и, значит, мы в известной мере коррелируем его с самим собой. Чтобы обойти эту сложность, мы обычно основываем анализ заданий на «скорригиро-ванных корреляциях "задание х общая оценка"» или же на «откорректированных по Гилфорду корреляциях "задание х общая
оценка"». В данном примере задание 1 будут коррелировать с суммой заданий 2, 3, 4 и 5, задание 2 будут коррелировать с суммой заданий 1, 3, 4 и 5 и т.д. Были предложены и другие методы для вычисления таких поправок, но они имеют психометрические проблемы (Cooper, 1983).
Каждый раз, когда задание изымается, следует подсчитывать надежность теста (альфа). По мере того как убираются задания, имеющие низкие корреляции с общей оценкой, величина альфа будет расти. Если изымается все больше и больше заданий, величина альфа в конце концов начнет падать, поскольку она зависит как от средней корреляции между заданиями, так и от числа заданий в тесте. Конечно, устранение «плохих» заданий увеличивает среднюю корреляцию между оставшимися заданиями, но это также делает тест короче. Задания последовательно удаляются (на основе анализа их скорригированных корреляций в парах «задание х х общая оценка» и аспектов теста, с которыми они связаны по своему происхождению) до тех пор, пока тест не станет коротким, хорошо сбалансированным и высоконадежным.
Одна весьма неприятная особенность этого способа анализа состоит в том, что невозможно просто посмотреть на таблицу скорригированных корреляций заданий и общей оценки и исходя из этого точно решить, какие задания следует изъять. Это происходит потому, что общая оценка каждого человека будет неизбежно меняться каждый раз, когда удаляется задание. Следовательно, решив, какое задание изымать, необходимо заново пересчитывать общие оценки, все корреляции оставшихся заданий с общей оценкой и на каждой стадии пересчитывать коэффициент альфа. Мягко говоря, это утомительно. Однако я написал компьютерную программу на языке Бейсик (внесена в список в работе: Kline, 1986), которая осуществляет такой анализ автоматически. Модернизированную версию для компьютеров системы Эппл Макинтош можно найти с помощью моей страницы в Интернете, сервер Школы психологии в Королевском университете Белфаста (http:// www.psych.qub.ac.uk). С другой стороны, этот анализ может быть относительно свободно выполнен с помощью имеющейся в SPSS процедуры установления надежности.
Задание для самопроверки 18.2
(а) Что может факторный анализ, взятый изолированно, обнаружить в структуре теста?
(б) Почему в классическом анализе заданий необходимо после удаления задания заново пересчитывать все корреляции между каждым заданием и общей оценкой?
(в) Назовите четыре проблемы, связанные с конструированием тестов с помощью критериального принципа.
Следующие шаги
Когда анализ заданий закончен, задача того, кто конструирует тест, все еще далека от завершения. Инструкции (и возможно, бланки для ответов) должны быть отточенными. Примеры заданий должны быть разработаны и проверены; затем переработанный (более короткий и скорее всего более надежный) тест предъявляется другой выборке, состоящей приблизительно из 200 человек, для повторной проверки его надежности и факторной структуры. На этой стадии следует также установить его валидность (например, путем конструктной валидизации, как описано в главе 13). В случае тестов способностей должен быть отмечен объем времени, который требуется испытуемым для выполнения теста, и должно быть принято решение, какие временные ограничения (если они предусмотрены) следует установить. В руководстве по применению теста следует представить результаты этих анализов, инструкции по предъявлению теста, схему обработки и как можно больше доказательств того, что тест надежен и валиден. •
Резюме
В этой главе дано представление о нескольких основополагающих принципах написания заданий как для тестов способностей, так и для личностных тестов. Анализ заданий предлагается рассматривать как процедуру для выделения и изъятия заданий, которые оказываются несоответствующими и которые снижают надежность и/или валидность теста. Обсуждены четыре метода проведения анализа заданий: критериальный подход, факторный анализ, теория сложности заданий и классический анализ заданий. Существенные проблемы были выделены в широко распространенной методике критериального подхода; теория сложности заданий требует специализированных компьютерных программ; поэтому для со-
•
здания коротких; надежных и потенциально валидных шкал рекомендуются факторный анализ и классический анализ заданий.
Предложения
по дополнительному чтению
Книга Галликсена (Gulliksen, 1986) представляет обязательное чтение для любого, кто заинтересован в оценке способностей и достижений в обучении. Книга Клайна Руководство по конструированию теста (Kline, 1986) содержит множество хороших практических советов по поводу целостного процесса разработки и валидизации теста, так же как и книги Моше и Зейднера (Moshe, Zeidner, 1995), а также Спектора (Spector, 1992). Ссылки на специфические методы анализа ответов на задания теста можно найти в главах 14, 15 и 16.
Ответы на задания по самопроверке
18.1. Если тест содержит много очень легких или очень трудных заданий, вы не получите четких различий между индивидуумами в выборке. Черта, которую тест предположительно измеряет, вероятно, нормально распределена (т.е. частотная диаграмма имеет колоколообразную форму). Если ваш тест включает много трудных заданий, он выявит тонкие различия между высокоспособными участниками (которых в выборке относительно мало). Если он включает много очень легких заданий, тест выявит тонкие отличия между участниками с низким уровнем способностей (но таких тоже окажется немного). Обычно у вас есть необходимость провести дифференциацию подавляющего большинства индивидуумов в выборке, и это подразумевает, что у вас имеется много заданий, которые хорошо устанавливают различия в диапазоне от р = 0,2 до р = 0,8, поскольку это именно те задания, которые позволяют видеть различия между большинством испытуемых в выборке.
18.2. (а) Факторный анализ может показать, сколько отдельных конструктов измеряется с помощью набора заданий; другие методы исходит из допущений, что измеряется только один конструкт. Иногда набор заданий может измерять две весьма высококоррелирующих, но различных способности, например, флюидный и кристаллический интеллекты, и действительно, Кэттелл (Cattell, 1971) утверждает, что эти два фактора обнаруживаются, когда используется факторный анализ для исследования тестов, сконструированных с помощью классического анализа заданий.
Дата добавления: 2015-03-03; просмотров: 513;