Определение надежности теста. Определение надежности целого теста
Страница 1

Инфо по психологии » Исследование уровня креативности менеджеров по рекламе » Определение надежности теста. Определение надежности целого теста

Термином «

надежность»характеризуется воспроизводимость, или стабильность, результатов тестирования. Если распределение тестовых оценок какой-либо группы, прошедшей тестирование когнитивных способностей, имеет простую среднюю арифметическую, равную 100, а через неделю у той же группы эта мера средней тенденции окажется равной 72, мы вынуждены будем заподозрить что-то неладное. Мы сочтем этот тест ненадежным, потому что его результаты не воспроизводятся. Общеизвестно, что результаты повторного тестирования одной и той же группы людей всегда несколько отличаются от результатов их первого тестирования, но если эта разница существенна, значит либо в самом тесте, либо в методике обсчета его результатов есть какой-то изъян.

Известны три метода определения надежности теста: метод определения ретестовой надежности, метод определения надежности взаимозаменяемых форм теста и метод определения надежности расщеплением. Метод определения ретестовой надежности основан на двукратном тестировании одной и той же группы людей и корреляции двух распределений тестовых оценок. Чем меньше коэффициент корреляции, называемый в данном случае коэффициентом надежности, отличается от +1 — идеального значения для положительной корреляции, — тем более надежным считается тест. В идеале, коэффициент надежности теста, который предполагается использовать в отборочном процессе, должен быть более +0,8, однако на практике приемлемым считается и тест с коэффициентом надежности, равным примерно +0,7. Однако этот метод имеет несколько ограничений. Экономически невыгодно дважды отвлекать людей от работы только для того, чтобы протестировать их. Кроме того, может сказаться и эффект научения: во-первых, люди запоминают вопросы после первого тестирования, а во-вторых, в промежутке между двумя тестированиями они могут приобрести определенный дополнительный опыт, в результате чего тестовые оценки во второй раз будут выше.

Метод определения надежности взаимозаменяемых форм теста тоже базируется на двукратном тестировании, однако в данном случае для повторного тестирования используется не тот же самый тест, а его эквивалентная, или параллельная, форма. Недостатком этого метода является то, что разработка двух самостоятельных и эквивалентных тестов непростая и дорогостоящая процедура.

Метод определения надежности расщеплением заключается в том, что после однократного применения теста входящие в него вопросы делят пополам с последующей корреляцией тестовых оценок за каждую из них. Преимущество этого метода в том, что он не требует больших затрат времени и позволяет ограничиться одним тестированием. При этом исключаются факторы, способные повлиять на вторую оценку.

В нашем исследовании повторное тестирование производилось спустя 36 дней с максимально приближенными условия первого тестирования.

Таблица 4.

Распределение индивидуальных баллов испытуемых по ретесту

30

27

29

33

21

35

30

26

28

34

30

24

29

29

31

27

21

33

29

27

28

32

34

22

Страницы: 1 2


Возрастная область затруднений
Возрастные особенности партнеров общения также могут вызвать затруднения. Известно, что ребенок до школы предпочитает общение со взрослыми; до среднего подросткового возраста почти половина детей предпочитает общение со сверстниками. Это предпочтение доминирует у старшеклассников до окончания школы, когда вновь около трети юношей и деву ...

Общая психологическая подготовка. Помощь в избавлении от вредных привычек
Вредных привычек, от которых каждый из нас хотел бы избавиться достаточно много, но в спортивной деятельности наиболее остро стоит вопрос об избавлении от курения. Современная прикладная психология накопила некоторый опыт помощи желающим избавиться от вредных привычек. Но работа с такими людьми требует специальной подготовки (например, ...

Выбор методик для исследований внимания младших школьников. Методики изучения объема внимания
Объем внимания характеризуется числом объектов, воспринимаемых одновременно в весьма ограниченный отрезок времени. Для изучения объема внимания используются две группы методов: - основанные на тахистоскопическом предъявлении букв, цифр, фигур; - основанные на отыскивании чисел. В первом случае для предъявления стимульного материала н ...