Матрица факторных весов с вращением и без вращения рейтинговых оценок по шкале оценки личности преподавателя (данные получены

посредством программы

Факторная матрица по окончании вращения представлена в колонках А’, В’ и С’ табли- цы. Часть дисперсии каждого задания та же самая, что и в факторной матрице до вращения факторов, но факторы, полученные по окончании вращения, легче интерпрети- ровать, чем в матрице до вращения. Вращение варимакс есть процедурой ор- тогонального вращения,в которой факторные оси остаются перпендикулярны- ми друг к другу. В противоположность данной процедуре факторные оси при обличе- ском(косоугольном) вращении формируют острые либо тупые углы по отношению друг к другу. Ортогональные факторы в большинстве случаев легче трактовать, чем ко- соугольные, потому, что эти факторы не коррелируют между собой (свободны).

При интерпретации факторной матрицы по окончании вращения направляться обратить особенное внимание на задания, каковые имеют вес 0,50 и выше по этому фактору. Четыре задания — 1 (тактичный), 2 (вежливый), 4 (доброжелательный) и 9 (тер- пеливый) — имеют высокие нагрузки по фактору А’. Соответственно подходящим заглавием для этого фактора имело возможность бы быть такое обозначение, как «деликат- ность» либо «вежливость». Еще четыре задания имеют высокие нагрузки, но уже по фактору В’: 6 (осведомленный), 8 (организованный), 10 (подготовленный) и

11 (пунктуальный), значит, соответствующим наименованием фактора В’ имело возможность бы быть «готовность». Наконец, три задания имеют высокие нагрузки по факто- ру С: 3 (креативный), 5 (увлеченный) и 7 (талантливый мотивировать); подходя- щим обозначением этого фактора имело возможность бы быть — «стимулирующий» либо «мо- тивирующий». Эти три фактора покупают психотерапевтический суть при опре- делении типа личности учителя, что предпочитают студенты.

SPSS — Статистический пакет для социальных наук (Statistical Package for the Social Sciences).

166 Глава 3. Психометрические базы психодиагностики: главные этапы…

Непременно, имеется значительно больше приложений для факторного анализа, чем те, на которых мы остановились. Сейчас факторному анализу посвящено множе- ство статей и книг. Одновременно с этим существуют большие разногласия не толь- ко довольно вращения факторов и наилучших процедур факторизации, но и в отношении их интерпретации. Однако факторный анализ был и остается одним из самые мощных инструментов психолога, разрабатывающего тесты.

Валидность теста

Существует достаточно большое количество различных способов доказательства валидности теста. О них и отправится обращение потом.

Тест именуется валидным,если он измеряет то, для измерения чего рекомендован.

Очевидная валидность— обрисовывает представление о тесте, сложившееся у ис- пытуемого. Тест обязан восприниматься обследуемым как важный инструмент познания его личности, чем-то схожий с вызывающим уважение и в какой-то ме- ре трепет медицинским диагностическим инструментарием. Очевидная валид- ность получает особенное значение в наше время, в то время, когда представление о тестах в публичном сознании формируется бессчётными публикация- ми в журналах и популярных газетах того, что возможно назвать квазитестами, с по- мощью которых читателю предлагается выяснить все, что угодно: от интеллек- та до совместимости с будущим супругом.

Конкурентная валидностьоценивается по корреляции созданного теста с другими, валидность которых довольно измеряемого параметра установ- лена. П. Клайн отмечает, что информацию о конкурентной валидности нужны тогда, в то время, когда имеется неудовлетворительно трудящиеся тесты для измерения некоторых пе- ременных, а новые создаются чтобы улучшить уровень качества измерения. В са- мом деле, в случае если уже существует действенный тест, то для чего нужен такой же новый?

Прогностическая валидностьустанавливается посредством корреляции между показателями теста и некоторым критерием, характеризующим измеряемое собственный- ство, но в более позднее время. К примеру, прогностическая валидность какого именно- или теста интеллекта возможно продемонстрирована корреляцией его показателей, полу- ченных у испытуемого в возрасте 10 лет, с отвлечённой успеваемостью в пери- од окончания школы . Л. Кронбах вычисляет прогностическую валидность самоё убедительным доказательством того, что тест измеряет как раз то, для чего он был рекомендован. Главная неприятность, с которой сталкивается исследо- ватель, пробующий установить прогностическую валидность собственного теста, состо- ит в выборе внешнего критерия. В особой степени значительно чаще это относится из- мерения личностных переменных, где подбор внешнего критерия — очень непростая задача, ответ которой требует большой изобретательности. Несколь- ко несложнее обстоит дело при определении внешнего критерия для когнитивных тестов, но и в этом случае исследователю приходится «закрывать глаза» на многие неприятности. Так, отвлечённая успеваемость традиционно употребляется в качестве внешнего критерия при валидизации тестов интеллекта, но в то же вре-

3.9. Стандартизация теста 167

мя хорошо как мы знаем, что удачи в обучении далеко не единственное свидетельство большого интеллекта.

Инкрементная валидностьимеет ограниченное значение и относится к слу- чаю, в то время, когда один тест из батареи тестов может иметь низкую корреляцию с крите- рием, но не перекрываться вторыми тестами из данной батареи. В этом случае дан- ный тест владеет инкрементной валидностью. Это возможно полезно при про- ведении профотбора посредством психотерапевтических тестов.

Дифференциальная валидностьможет быть проиллюстрирована на примере тестов заинтересованностей. Тесты заинтересованностей в большинстве случаев коррелируют с отвлечённой успева- емостью, но по-различному для различных дисциплин. Значение дифференциальной валидности, так же как и инкрементной, ограничено.

Содержательная валидностьопределяется через подтверждение того, что за- дания теста отражают все нюансы изучаемой области поведения. В большинстве случаев она определяется у тестов достижений (суть измеряемого параметра всецело ясен!), каковые, как уже указывалось, тестами фактически психотерапевтическими не являются. На практике для определения содержательной валидности подбирают- ся специалисты, каковые показывают, какая область (области) поведения самый ответственна, к примеру, для музыкальных свойств, а после этого, исходя из этого, гене- рируются задания теста, каковые снова оценивают специалисты.

Конструктная валидностьтеста демонстрируется полным, как это воз- возможно, описанием переменной, для измерения которой предназначается тест. По сути дела, конструктная валидность включает в себя все подходы к определению валидности, каковые были перечислены выше. Кронбах и Мил (Cronbach Meehl,

1955), каковые ввели в психодиагностику понятие конструктной валидности, пробовали решить проблему отбора параметров при валидизации теста. Они подчер- кивали, что во многих случаях ни один раздельно забранный критерий не имеет возможности слу- жить для валидизации отдельного теста. Можно считать, что решение вопроса о конструктной валидности теста является поиском ответа на два вопроса:

1) существует ли реально некое свойство; 2) надежно ли измеряет этот тест личные различия по этому свойству. Ясно, что с конструкт- ной валидностью связана неприятность объективности в интерпретации результатов по изучению конструктной валидности, но эта неприятность общепсихологиче- ская и выходит за рамки валидности (подробнее см. гл. 2).

Из сказанного выше направляться, что не существует какого-либо единичного до тех пор пока- зателя, благодаря которому устанавливается валидность психотерапевтического теста. В отличие от показателей надежности и дискриминативности, нельзя осуществить правильные статистические расчеты, подтверждающие валидность методики. Однако разработчик обязан представить весомые доказательства в пользу валидно- сти теста, что потребует от него интуиции и психологических знаний.

Стандартизация теста

Одним из ответственных отличий психометрических тестов есть то, что они стан- дартизированы,а это разрешает сравнить показатели, полученные одним испы- туемым, с таковыми в главной совокупности либо соответствующих группах.

168 Глава 3. Психометрические базы психодиагностики: главные этапы…

Тем самым достигается адекватная интерпретация показателя отдельного испы- туемого. Так, стандартизация теста самый ответственна в тех случаях, ког- да осуществляется сравнение показателей обследуемых. Наряду с этим вводится поня- тие нормы,либо нормативных показателей.Для получения стандартных норм необходимо шепетильно отобрать большее количество испытуемых в соответствии с светло обозначенным критерием. При формировании выборки стандартизации направляться учитывать ее репрезентативность и объём. В управлениях по тестам значительно чаще указывается на то, что для несложного уменьшения стандартной погрешности до- статочной будет выборка из 500 испытуемых. Но репрезентативность выбор- ки не зависит от ее количества. К примеру, для того чтобы получить нормативные по- казатели для всей популяции детей, обучающихся в начальной школе, потребует- ся выборка количеством более 10 тысяч, в то время как выборка из таковой ограниченной популяции, как шеф-пилоты авиакомпаний, не может быть столь большой. Репрезентативность выборки, так, параметр более серьёзный, нежели ее количество. В некоторых случаях приходится вырабатывать пара групп стандар- тизации либо стратифицировать группу стандартизации довольно таких пара- метров, как возраст, пол, социальный статус. Устанавливать нормы не всегда обя- зательно. При применении психотерапевтических тестов в научном изучении нормы не столь серьёзны и достаточно «сырых» показателей теста.

Нормы для каждой группы должны быть представлены в средних размерах и показателе стандартного отклонения. Расчет средней величины элементарен и прекрасно известен, а стандартное отклонение определяется посредством формулы, имеющей вид:

где SD — стандартное отклонение; X2 — итог всего опросника всех испытуе- мых; п — количество испытуемых; — сумма.

Сейчас на практике все больше употребляется таковой тип производной оценки, как стандартные показатели,удовлетворяющий практически всем требований, предъ- являемых к психотерапевтическому измерению. Такие показатели высказывают отличие личного результата испытуемого от среднего в единицах стандартного отклонения соответствующего распределения. Стандартные показатели получа- ют двумя дорогами: линейным и нелинейным преобразованием первичных («сы- рых») оценок. При линейного преобразования сохраняются все свойства ис- ходного распределения «сырых» оценок, и такие показатели именуются стандарт- ными либо z-показателями. Для вычисления г-показателя находят разность между средним и первичной оценкой для нормативной группы и дробят ее на стандарт- ное отклонение нормативной группы. Формула имеет форму:

Тут нужно сообщить о том, что главной причиной преобразования пер- вичных оценок в некую производную шкалу есть желание взять по- казатели, каковые сопоставимы между собой независимо от того, по какому

3.9. Стандартизация теста 169

тесту они взяты. Линейное преобразование дает возможность приобрести показатели сопоставимые только в том случае, в то время, когда распределения «сырых» оценок, по кото- рым они рассчитываются, имеют приблизительно однообразную форму. Чтобы сопоставлять показатели, полученные на базе распределений различной формы, прибегают к нелинейному преобразованию, либо к нормализованным стандарт- ным показателям.Процедура нелинейного преобразования достаточно несложна и обрисована в бессчётных управлениях по математической статистике. Такие показатели в большинстве случаев рассчитывают посредством таблиц. В этих таблицах приводит- ся процент случаев, приходящихся на участки, каковые отстоят от среднего нор- мальной кривой на некое число единиц стандартного отклонения. Сперва определяют процент лиц, чьи показатели превышают каждую «сырую» оценку, а после этого по этому проценту в таблице отыскивают соответствующее значение нор- мализованного стандартного показателя. Эти показатели, как и линейно преоб- разованные, будут иметь среднее (X), равное 0, и стандартное отклонение (SD), равное 1. Нулевое значение говорит о том, что испытуемый попадает в точку, соот- ветствующую среднему обычной кривой, превосходя 50 % группы. , если показатель равен —1, испытуемый превосходит приблизительно 16 % группы, а ес- ли + 1 — превосходит 84 % группы. Нормализованным стандартным показателям возможно придать любую эргономичную форму, к примеру, умножив его на 10 и прибавив произведение к 50, приобретаем так называемый «T-показатель» и в этом случае Т, равное 50, соответствует среднему, равному 60 — превышает среднее на одно стан- дартное отклонение и т. д. С другими, не меньше популярными нелинейными пре- образованиями «сырых» показателей теста, возможно ознакомиться в соответствую- щей литературе1.

Созданием стандартизованного теста и его публикацией в большинстве случаев завершается работа психолога, но направляться не забывать и о том, что с течением времени не- обходим пересмотр(ревизия) теста. Достаточно отыскать в памяти о тестах интеллекта (см. гл. 4), нормы по которым устаревают через каждые 5 лет, и возможно предполо- жить, что процесс их старения будет ускоряться. Для наглядности этапы конст- руирования теста представлены на рис. 3.1.

Пример из практики: определение надежности опросника 16 PF Кеттелла.Личностный опросник Раймонда Кеттелла 16 PF(16 личностных факторов) от- носится к самый распространенным психодиагностическим инструментам и не испытывает недостаток в особом представлении. Уже почти 50 лет психологи всей земли применяют его для ответа разнообразных прикладных и научных задач. Но как в бывшем СССР, так и сейчас во снова грамотных государствах данный опросник, не обращая внимания на достаточно громадную популярность, употребляется непро- фессионально, с нарушением всех правил и норм, предъявляемых к психологиче- ским тестам.

Не считая разных переводов опросника, каковые значительно отличаются один от другого, в русскоязычной литературе довольно часто видятся и разные

См., напр., БурлачукЛ. Ф., Морозов С. М. Словарь-справочник по психодиагностике. — СПб.: Питер,

1999, и Гласс Дж., Стэнли Дж. Статистические способы в психологии и педагогике / Пер. с англ. — М.: Прогресс, 1976.

170 Глава 3. Психометрические базы психодиагностики: главные этапы.

Рис. 3.1. Этапы конструирования теста

«ключи» к его факторам. Размещённые в бессчётных сборниках и бро- шюрах варианты опросника не защищены (!) от неточностей и произвольного вмеша- тельства в его текст. В случае если добавить к этому отсутствие нормативных данных, и то, что не проводилась проверка гомогенности шкал опросника на отече- ственных зыборках, то неясно, какого именно рода результаты приобретали его многочи- сленные пользователи, какими диагностическими заключениями они оперировали. За последние пятнадцать лет у нас появились лишь три (!) работы, в которых ста- вилась задача проверки факторной структуры 16PF на. национальных выборках:

3.9. Стандартизация теста 171

это статьи В. М. Русалова и О. В. Гусевой (1990), Ю. М. Забродина, В. И. Похиль- ко и А. Г. Шмелева (1987), наконец, украинского психолога А. Г. Виноградова (1997). Читателю нетрудно сравнить это количество публикаций с тем множе- ством работ, в которых опросник употреблялся для получения «диагностически значимых результатов». Сообщённое разрешает сделать вывод о том, что посредством опросника 16PF измеряется что-то, имеющее неясное отношение к факторам лич- ности, выделенным и обрисованным Кеттеллом.

Занимаясь работой по психометрической адаптации личностных опросников1, мы не могли обойти вниманием и столь обширно распространенный, как 16PF. За базу была забрана форма «А» опросника 16PF. Были обследованы 227 мужчины (135 и человек 92 женщин) в возрасте от 16 до 51 года. Средний возраст иссле- дуемых составлял 28 лет. Это были люди, каковые проходили отбор на разные должности в коммерческие структуры Киева, все они имели высшее либо сред- нее особое образование (бухгалтеры, коммерческие директоры, менеджеры различного уровня).

Как мы знаем, точность измерения посредством психодиагностического инстру- мента определяется его надежностью. С целью узнать, как точен прогноз, даваемый психологом на основании результатов 16PF, эти, первоначально по- лученные нами, были оценены по авторским ключам на внутреннюю согласован- ность посредством коэффициента Кронбаха, вычисляемого по следующей формуле:

где a — коэффициент Кронбаха; r — количество заданий теста; S — дисперсия по

j-му пункту теста; — дисперсия суммарных баллов по всему тесту.

В табл. 3.6 находятся информацию о внутренней согласованности факторов лично- сти, полученные по авторским «ключам» (приведено буквенное обозначение фак- тора). Как видно из таблицы, значение коэффициента Кронбаха неудовлетвори- тельно для большинства факторов. А фактор N по большому счету измеряет что-то, не имею- щее никакого отношения к проницательности, наивности и расчётливости (в случае если использовать обыденное наименование этого фактора). Только кое-какие из факторов, к примеру фактор F (сургенция—десургенция) и фактор H пармия—тректия (сме- лость—робость), надежно измеряют то, что должны измерять. Так, в следствии проверки надежности—согласованности уникальных ключей было продемонстрировано, что последовательность шкал опросника негомогенны. Возможно высказать предположение, что это следствия искажения смысла заданий при переводе на русский язык и/либо суще- ствования известных культурных различий.

Чтобы распознать, что же как раз стоит за данными, приобретаемыми с по- мощью 16PF, мы применяли факторный анализ. Факторы извлекались способом

Создатель высказывает собственную признательность за участие в данной работе собственному бывшему аспиранту Виталию

Духневичу.

172 Глава 3. Психометрические базы психодиагностики: главные этапы…

Таблица3.6

Фильм «Матрица»: скрытый суть. Нео не спаситель


Также читать:

Понравилась статья? Поделиться с друзьями: