Определение надежности теста

Тест в большинстве случаев считается надежным,в случае если с его помощью получаются одинаковые показатели для каждого обследуемого при повторном тестировании.

В психометрике термин надежность имеет два значения. На одном из них — на- дежности по внутренней согласованности— мы не будем останавливаться под- робно, отсылая читателя к руководствам и соответствующим справочникам1, от- метив лишь, что требование к внутренней согласованности теста не просто так. В полной мере конечно вычислять, что в случае если некая переменная измеряется частью теста, то другие его части, не будучи согласованными с первой, измеряют что-то второе. Чтобы быть валидным, тест должен быть согласованным. Суще- ствует пара способов определения надежности.

Надежность ретестовая— предполагает повторное предъявление того же само- го теста тем же испытуемым и приблизительно в тех же условиях, что начальное, а после этого установление корреляции между двумя последовательностями данных. При применении этого метода определения надежности необходимо отдавать себе отчет в том, что испыту- емые смогут запомнить собственные ответы и воспроизвести их во второй раз, исходя из этого по- вторное тестирование должно быть отделено от первого более-менее большим временным промежутком, в большинстве случаев не меньше месяца. Кое-какие психологи настаи- вают на промежутке между тестированиями не меньше 6 месяцев (Клайн, 1994).

Мы не вычисляем требование П. Клайна об необходимом 6 месячном промежутке между тестированиями безусловным. В подтверждение сошлемся на результаты изучения канадских психологов. Посредством личностного опросника были обследованы 302 студента с промежутком в 3 семь дней. Условия повторного тестиро- вания варьировались. Обычный коэффициент ретестовой надежности, равный

0,872, не отличался от коэффициентов надежности, взятых в трех группах испытуемых, приобретавших одну из трех своеобразных руководств: 1) продумы- вать ответы; 2) применять воспоминания о прошлых ответах; 3) делать параллельную форму теста. Было найдено, что обычный коэффициент надежности выше коэффициента, взятого при инструкции воспроизводить прошлые ответы.

Мельчайшим удовлетворительным значением для ретестовой надежности яв- ляется коэффициент корреляции, равный 0,7. Действительно, для некоторых тестов данный показатель возможно немного ниже.

Изданный под отечественной редакцией перевод с английского книги П. Клайна «Справочное управление

по конструированию тестов» (Киев, 1994), до тех пор пока, к сожалению, единственная на русском дос- таточно подробная работа по конструированию тестов, может удовлетворить интерес читателя к данной проблеме.

162 Глава 3. Психометрические базы психодиагностики: главные этапы…

Надежность параллельных формпредусматривает создание эквивалентных форм опросника и предъявление их одним и тем же испытуемым чтобы после этого оценить корреляцию между взятыми результатами. Главная пробле— ма, мешающая широкому распространению этого метода определения на- дежности, — необходимость подготовки двух комплектов заданий, что очень сложно, потому, что требуются убедительные доказательства их эквивалентности.

Надежность частей тестаопределяется методом деления опросника на две час- ти (в большинстве случаев на четные и нечетные задания), по окончании чего и рассчитывается корреля- ция между этими частями. В большинстве случаев к этому методу определения надежности ре- комендуется прибегать лишь в тех случаях, в то время, когда нужно скоро взять результаты.

Для определения ретестовой надёжности и надёжности параллельных форм корреляции подсчитывается на базе коэффициента произведения моментов Пирсона. Эта процедура подсчета рассматривалась нами ранее, в разделе, посвя- щенном анализу заданий. Для определения надежности частей теста ранее рассчи- танный коэффициент произведения моментов Пирсона (между двумя полови- нами теста) употребляется в формуле Спирмена—Брауна. Формула Спирмена— Брауна имеет форму:

где — надежность, оцененная для всего опросника; — корреляция между дву- мя половинами опросника.

К примеру, в случае если коэффициент корреляции произведения моментов Пирсона между двумя половинами теста равен 0,80, то:

Выделим, что наилучшей процедурой определения надежности есть проведение повторных изучений через более либо менее большие времен- ные промежутки.

Все изучения надежности должны быть выполнены на больших (рекомендуется 200 и более испытуемых) и репрезентативных выборках. Надеж- ность — серьёзная черта теста, но сама по себе ценности не воображает. Она нужна с целью достижения валидности.

Факторный анализ

Во многих случаях перед разработчиком теста поднимается задача «сжатия» информа- ции либо, в противном случае говоря, компактного описания изучаемых явлений при наличии множества наблюдений либо переменных. Факторный анализкак раз и есть способом понижения размерности изучаемого многомерного явления.

Напомним читателю, что факторный анализ зародился в психотерапевтической на- уке и связан прежде всего с изучениями Ч. Спирмена (Spearman, 1904). Последующими работами таких выдающихся психологов, как Т. Келли, Л. Тер-

3.7. Факторный анализ 163

стоуна, Дж. Гилфорда и Р. Кэттелла, и математиков К. Пирсона, К. Холзин- гера, Г. Хармана и др., был достигнут большой успех в математическом обо- сновании факторного анализа, и данный способ начинает активно использоваться в раз- личных науках.

Как известно, одной из обычных форм представления эксперимен- тальных данных есть матрица, столбцы которой соответствуют, к примеру, разным тестам (заданиям тестов), а строки — отдельным итогам (значе- ниям), взятым в следствии их применения. Визуальный анализ сколь-ни- будь большой по величине матрицы неосуществим, а исходя из этого требуется финал- ную данные сжать, извлечь из нее самоё важное, значительное. В первую очередь исследователю нужно взять корреляционную матрицу (подсчет ко- эффициентов корреляции).

Воспользуемся как пример изучением Л. Айкена (Aiken, 1996). В этом изучении 90 студентов колледжа просили оценить учителя с по- мощью пятибалльной шкалы (1 — низший балл, 5 — верховный) по 11 параметрам: тактичность, вежливость, креативность, доброжелательность, увлеченность сво- им предметом, знание предмета, свойство мотивировать студентов, организо- ванность, терпеливость, пунктуальность и подготовленность.

В случае если поделить матрицу корреляций рейтинговых оценок, данных студентами по перечню качеств личности учителя (табл. 3.4) на два равных треугольни- ка, совершив диагональ из левого верхнего угла в правый нижний угол, то возможно заметить, что это — симметричная матрица, в которой первая верхняя строка со- стоит из тех же оценок, что и первая колонка. Подобно вторая строка включает те же самые элементы, что и вторая колонка, и т. д. Кроме этого необходимо обратить внима- ние на то, что все числа на главной диагонали (начиная сверху слева впредь до чисел внизу справа) равны +1,00 — это предполагаемая корреляция каждого за- дания шкалы с самим собой.

В психотерапевтическом тестировании цель факторного анализа содержится в том, дабы отыскать пара фундаментальных факторов, каковые растолковывали бы боль- шую часть дисперсии в группе оценок по разным тестам либо вторым психомет- рическим измерениям. В вышерассмотренном примере — 11 переменных, поэто- му для него задача факторного анализа содержится в том, дабы отыскать матрицу факторных нагрузокили корреляции между заданиями шкалы и факторами. Су- ществует пара процедур факторного анализа, но все они предполагают две стадии: 1) факторизациюматрицы корреляций, с тем дабы оказалась первона- чальная факторная матрица; 2) вращение факторной матрицы, с тем дабы обна- ружить самая простую конфигурацию факторных нагрузок (см. табл. 3.4).

Стадия факторизации в этом ходе призвана выяснить количество фак- торов, нужных для объяснения связей между разными тестами, и обес- печивает получение первичных оценок нагрузки (веса) каждого теста по каждо- му фактору. Вращение факторов нужно чтобы сделать их более по- нятными (трактуемыми) посредством создания конфигурации факторов, в которой очень мало тестов имеют высокие нагрузки, в то время как большинство тестов имеют низкие нагрузки по любому фактору.

164 Глава 3. Психометрические базы психодиагностики: главные этапы…

Таблица 3.4

Надежность. Отказ


Также читать:

Понравилась статья? Поделиться с друзьями: