Определение надежности теста. Определение надежности
целого тестаСтраница 1
Термином «
надежность»характеризуется воспроизводимость, или стабильность, результатов тестирования. Если распределение тестовых оценок какой-либо группы, прошедшей тестирование когнитивных способностей, имеет простую среднюю арифметическую, равную 100, а через неделю у той же группы эта мера средней тенденции окажется равной 72, мы вынуждены будем заподозрить что-то неладное. Мы сочтем этот тест ненадежным, потому что его результаты не воспроизводятся. Общеизвестно, что результаты повторного тестирования одной и той же группы людей всегда несколько отличаются от результатов их первого тестирования, но если эта разница существенна, значит либо в самом тесте, либо в методике обсчета его результатов есть какой-то изъян.
Известны три метода определения надежности теста: метод определения ретестовой надежности, метод определения надежности взаимозаменяемых форм теста и метод определения надежности расщеплением. Метод определения ретестовой надежности основан на двукратном тестировании одной и той же группы людей и корреляции двух распределений тестовых оценок. Чем меньше коэффициент корреляции, называемый в данном случае коэффициентом надежности, отличается от +1 — идеального значения для положительной корреляции, — тем более надежным считается тест. В идеале, коэффициент надежности теста, который предполагается использовать в отборочном процессе, должен быть более +0,8, однако на практике приемлемым считается и тест с коэффициентом надежности, равным примерно +0,7. Однако этот метод имеет несколько ограничений. Экономически невыгодно дважды отвлекать людей от работы только для того, чтобы протестировать их. Кроме того, может сказаться и эффект научения: во-первых, люди запоминают вопросы после первого тестирования, а во-вторых, в промежутке между двумя тестированиями они могут приобрести определенный дополнительный опыт, в результате чего тестовые оценки во второй раз будут выше.
Метод определения надежности взаимозаменяемых форм теста тоже базируется на двукратном тестировании, однако в данном случае для повторного тестирования используется не тот же самый тест, а его эквивалентная, или параллельная, форма. Недостатком этого метода является то, что разработка двух самостоятельных и эквивалентных тестов непростая и дорогостоящая процедура.
Метод определения надежности расщеплением заключается в том, что после однократного применения теста входящие в него вопросы делят пополам с последующей корреляцией тестовых оценок за каждую из них. Преимущество этого метода в том, что он не требует больших затрат времени и позволяет ограничиться одним тестированием. При этом исключаются факторы, способные повлиять на вторую оценку.
В нашем исследовании повторное тестирование производилось спустя 36 дней с максимально приближенными условия первого тестирования.
Таблица 4.
Распределение индивидуальных баллов испытуемых по ретесту
|
30 |
27 |
29 |
33 |
21 |
35 |
30 |
26 |
28 |
34 |
30 |
24 |
|
29 |
29 |
31 |
27 |
21 |
33 |
29 |
27 |
28 |
32 |
34 |
22 |
А.Н. Леонтьев о трансформации деятельности
деятельность может утратить свой мотив и превратиться в действие, а действие, при изменении его цели, может превратиться в операцию. В данном случае говорят об укрупнении единиц деятельности. Например, при обучении управлению автомобилем первоначально каждая операция (например, переключение передач) формируется как действие, подчиненное ...
Представления о психике в эпоху Античности
Периодизация античной философии:
1) Этап натурфилософии - шел поиск общего принципа устройства мира; устройство души выводилось из общего принципа мироздания как частное следствие Проблему души отдельно не рассматривали.
2) - человека объявили единственно заслуживающей интереса реальностью. Познание души считалось ключом к познанию ми ...
Дауншифтинг на Западе и в России
Как социальное явление дауншифтинг набирает силу. Масштабное исследование, проведенное Australia Institute, показало, что за последний десяток лет около 23% жителей самого маленького континента перешли на более скромный уровень жизни.
Наибольшее развитие дауншифтинг получил в США и Австралии. Согласно недавним опросам общественного мне ...