Определение надежности теста. Определение надежности целого теста
Страница 1

Инфо по психологии » Исследование уровня креативности менеджеров по рекламе » Определение надежности теста. Определение надежности целого теста

Термином «

надежность»характеризуется воспроизводимость, или стабильность, результатов тестирования. Если распределение тестовых оценок какой-либо группы, прошедшей тестирование когнитивных способностей, имеет простую среднюю арифметическую, равную 100, а через неделю у той же группы эта мера средней тенденции окажется равной 72, мы вынуждены будем заподозрить что-то неладное. Мы сочтем этот тест ненадежным, потому что его результаты не воспроизводятся. Общеизвестно, что результаты повторного тестирования одной и той же группы людей всегда несколько отличаются от результатов их первого тестирования, но если эта разница существенна, значит либо в самом тесте, либо в методике обсчета его результатов есть какой-то изъян.

Известны три метода определения надежности теста: метод определения ретестовой надежности, метод определения надежности взаимозаменяемых форм теста и метод определения надежности расщеплением. Метод определения ретестовой надежности основан на двукратном тестировании одной и той же группы людей и корреляции двух распределений тестовых оценок. Чем меньше коэффициент корреляции, называемый в данном случае коэффициентом надежности, отличается от +1 — идеального значения для положительной корреляции, — тем более надежным считается тест. В идеале, коэффициент надежности теста, который предполагается использовать в отборочном процессе, должен быть более +0,8, однако на практике приемлемым считается и тест с коэффициентом надежности, равным примерно +0,7. Однако этот метод имеет несколько ограничений. Экономически невыгодно дважды отвлекать людей от работы только для того, чтобы протестировать их. Кроме того, может сказаться и эффект научения: во-первых, люди запоминают вопросы после первого тестирования, а во-вторых, в промежутке между двумя тестированиями они могут приобрести определенный дополнительный опыт, в результате чего тестовые оценки во второй раз будут выше.

Метод определения надежности взаимозаменяемых форм теста тоже базируется на двукратном тестировании, однако в данном случае для повторного тестирования используется не тот же самый тест, а его эквивалентная, или параллельная, форма. Недостатком этого метода является то, что разработка двух самостоятельных и эквивалентных тестов непростая и дорогостоящая процедура.

Метод определения надежности расщеплением заключается в том, что после однократного применения теста входящие в него вопросы делят пополам с последующей корреляцией тестовых оценок за каждую из них. Преимущество этого метода в том, что он не требует больших затрат времени и позволяет ограничиться одним тестированием. При этом исключаются факторы, способные повлиять на вторую оценку.

В нашем исследовании повторное тестирование производилось спустя 36 дней с максимально приближенными условия первого тестирования.

Таблица 4.

Распределение индивидуальных баллов испытуемых по ретесту

30

27

29

33

21

35

30

26

28

34

30

24

29

29

31

27

21

33

29

27

28

32

34

22

Страницы: 1 2


На мостике
Перед началом игры создается воображаемая ситуация. Взрослый разделяет всех детей на две группы, разводит их в разные стороны и предлагает представить, что они находятся по разные стороны горного ущелья, но им нужно обязательно перейти на другую сторону. Через ущелье перекинут тонкий мостик (на полу чертится полоска — 30—40 см, символиз ...

Введение.
Наверное каждому из нас приходилось сталкиваться с конфликтными ситуациями. Конфликты проявляются в деятельности всех социальных институтов, социальных групп, во взаимоотношениях между людьми и играют ключевую роль в жизни отдельного человека, семьи, коллектива, государства, общества и человека в целом. Работающие в организации люди ра ...

Тест на определения уровня креативности менеджеров по рекламе
При проведении теста необходимо учитывать, что креативность проявляется в полной мере только в благоприятных условиях. Неблагоприятные функциональные состояния, сложные условия проведения, недостаточно доброжелательная атмосфера тестирований резко понижают результаты. Данное требование является общим при проведении тестирования любых фо ...