Меры связи: основанные на модели прогноза и ранговые

Модальные меры Гуттмана. Сравнение распределений при помощи меры Л. Гудмена и Е. Краскала. В то время, когда социолог имеет дело с ранжированными последовательностями? Принцип сравнения ранжированных последовательностей. Связанные ранги. Коэффициенты ранговой корреляции Д. Гудмена и Е. Краскала, Р. Сомерса, М. Дж. Кендалла.

Приведем примеры коэффициентов связи для признаков, имеющих номинальный уровень измерения. Специфика социологических данных такова, что социолог по большей части трудится с номинальным уровнем измерения. Исключение составляют первый (национальная статистика) и третий (бюджеты времени) типы социологической информации.

В качекакое количество примера разглядываем связь между удовлетворённостью и будущей профессией студента учебой. Это, не обращая внимания на то, что второй из них измерен по порядковой шкале. До тех пор пока эту упорядоченность никак не используем. Социологу приходится довольно часто так поступать, потому что он постоянно работает с эмпирией в ситуации разнотипности шкал.

Разглядим меры, основанные на так называемой модели прогноза. У нас с вами имеется одномерное распределение какого-либо признака. Напоминаем, что под показателем понимаем как раздельно взятый эмпирический индикатор (замечаемый показатель), так и производный от эмпирических индикаторов показатель. Пускай таковым показателем будет удовлетворенность учебой (У). Распределение этого показателя можем трактовать следующим образом. Имеется значения показателя (разные степени удовлетворенности учебой), и имеется возможности этих значений (относительные частоты в долях либо частости). А, правильнее, оценки возможности, полученные по выборке. Все, что рассчитывается по выборочной совокупности, называется оценками подлинных (существующих для изучаемой генеральной совокупности) значений. Очевидно, социолог может опускать термин «оценка», в случае если осознаёт, о чем идет обращение. Для простоты мы будем поступать так же.

Итак, отечественные возможности P0j равны маргинальным частотам по столбцам (как раз они соответствуют показателю (У) ¾ удовлетворенность учебой), дроблённым на неспециализированное число опрошенных студентов-гуманитариев (n00). В виде формулы это выглядит так: . Тогда, по нижеприведенной таблице 3.5.1 (это та же таблица сопряженности, с которой мы всегда работаем), возможности пяти степеней удовлетворенности учебой равны:

Эти возможности возможно трактовать как возможности статистического предсказания (У). Мы же их взяли по «хорошей» выборке. Исходя из этого в случае если из отечественной изучаемой главной совокупности студентов-гуманитариев случайно выберем некоего студента, то возможность того, что у этого случайного студента окажется большая удовлетворенность учебой, мала. Это вследствие того что по выборке она была равна всего лишь 0,05. Возможность «отгадать» все остальные варианты удовлетворенности учебой также невелика потому что они, как видите, не больше, чем 0,3. Наряду с этим само понятие «возможность» возможно трактовать на уровне обыденного сознания. Лишь в повседневной судьбе вам в большинстве случаев говорят, к примеру, «вероятность того, что у меня на следующий день будет нехорошее настроение для прогулки, равна 90%» либо «возможность того, что я на следующий день приду к тебе к себе домой, меньше 50%» либо «возможность отечественной вероятной встречи «фифти — фифти» (50 на 50)». И вы постоянно понимаете, что сие означает. Наряду с этим такие суждения вы интерпретируете не столько количественно, сколько как следует. А в математических формулах пользуются не процентами для оценки возможности, а долями ¾ частостями — и возможность принимает в полной мере конкретное значение из промежутка от 0 до 1.

Сейчас в полной мере правомерно поставить вопрос: Как изменятся вычисленные нами возможности иметь ту либо иную степень удовлетворенности учебой, в случае если привлечь к анализу второй показатель(будущую профессию студента)? Возможно вопрос поставить и по-второму: Накакое количество знание будущей профессии прибавит знания об удовлетворенности учебой? Либо: Как информация о будущей профессии изменит данные об удовлетворенности учебой?Поиск ответа на последний вопрос порождает меры связи, основанные на понятии энтропии (мы касались этого понятия при введении качественных коэффициентов вариации). Для того чтобы рода меры мы не будем рассматривать. Вы имеете возможность с ними познакомиться в работах [3, 8, 11].

Первый отечественный вопрос возможно поставить и без того: Как и как изменятся возможности предсказания удовлетворенности учебой, в случае если учесть будущую профессию?Как вы уже догадываетесь, по сути речь заходит о знании условных распределений отечественного показателя (У) либо условных частот, либо условных возможностей, т. е. возможностей, каковые логично обозначить как Р…. Индекс первый (j) относится к столбцам, т. е. к удовлетворенности учебой (показатель У), второй (i) относится к строчкам, т. е. к будущей профессии (показатель X), а косая линии выделяет, что показатель (X) есть условием.

Существуют всевозможные коэффициенты, помогающие отыскать ответ на подобные вопросы. Как видно из отечественных рассуждений, они должны быть направленными и носить, так же как и меры, основанные на хи-квадрат, темперамент «глобальный», т. е. давать оценку связи в целом для всей таблицы сопряженности в отличие от локальных мер (сообщение отдельных особенностей).

В случае если для кого-то термин «предсказание» остался до тех пор пока непонятым, то при описании предлагаемых ниже мер как возможно реже будем пользоваться этим термином.

Меры l (лямбда) Л. Гуттмана

Таких мер три, две из них направленные, а одна является усреднением первых двух. Мы приведем лишь одну lу/х. Эта мера, данный коэффициент характеризует при отечественной задачи влияние будущей профессии (X) на удовлетворенность учебой (У). Отвечает на вопрос, как изменяется предсказание (У) при знании (X). Ниже приводится формула, в которой употребляются известные вам обозначения, за исключением:

niшах ¾ большая частота в i-й строке:

nотах ¾ большая частота среди маргинальных частот по столбцам.

Эта формула была бы понятнее, в случае если вместо частот использовать частости (доли), трактуемые как возможности [11, с. 126]. Такую формулу мы не будем приводить, дабы не пугать излишними формулами. Отметим только, что в литературе приводится как формула, записанная через полные частоты, так и через частости. Помимо этого, фамилия Гуттмана также приводится по-различному. Например, Гудман в работе 8, с. 131. Это не верно уж принципиально важно.

Чтобы пояснить содержательный суть данной меры, этого коэффициента, ниже приводится та же таблица сопряженности, с которой мы всегда работаем для изучения связи между «будущей профессией студента» (показатель X) и «удовлетворенностью учебой» (показатель У). Таблица 3.5.1 содержит те же частоты, что и таблица 3.3.1, за исключением обозначений самих частот. В нее добавлен новый столбец ¾ последний с большими частотами по всем строчкам, включая строчок с маргинальными частотами по столбцам. Они нам нужны для вычисления коэффициента lу/х Гуттмана.

Чему же равен коэффициент в нашем случае? Он рассчитывается весьма легко.

Кроме того по тому, как вычисляется коэффициент, видно, что он разрешает определять, существуют ли в строчках модальные группы, т. е. имеется ли в каждой опытной группе четко выраженная, довольно часто встречаемая «степень удовлетворенности учебой». Если судить по отечественной таблице, таких групп нет, что и подтверждается мелким значением коэффициента. Какими же особенностями обладает данный коэффициент?

1. Он изменяется от нуля до единицы.

2. Он равен единице лишь в одном случае, в то время, когда в каждой опытной группе все студенты имеют однообразную степень удовлетворенности учебой и наряду с этим в каждой хорошую от другой. Если бы отечественная таблица сопряженности при тех же маргинальных частотах имела бы таковой вид, как это представлено в таблице .3.5.2, коэффициент был бы равен 0,86.

Итак, визуально мы замечаем наличие модальных групп в строках, не считая последней. Если бы в отечественной таблице число строчков равнялось числу столбцов, к примеру, не было бы историков, то коэффициент был бы равен 1, а таблицу возможно было бы перестановкой столбцов перевоплотить в такую, в которой лишь диагональные элементы отличались бы от нуля. Так, по значению коэффициента возможно делать выводы о степени отличия настоящей таблицы от диагональной. При, в то время, когда значение коэффициента равняется 1, возможность статистического предсказания (У) по Xмаксимальная. Таковой случай фактически в социологических изучениях не видится.

3. Значение коэффициента равняется нулю в нескольких случаях. Первый ¾ все частоты сосредоточены лишь в одной строке. В действительности знание показателя X нечего не дает для повышения знания об У. Второй случай ¾ отсутствие феномена модальности, т. е., условно говоря, полная «размытость» данных в таблице. По таблице 3.5.1 мы взяли значение, близкое к нулю и равное 0,05. Практически модальность не отмечается. И наконец, третий случай, в то время, когда все частоты сосредоточены лишь в одном столбце.

Данный случай заслуживает особенного внимания, потому что противоречит главному содержанию коэффициента. В случае если эти сосредоточены в одном столбце, то конечно модальные классы существуют. Тогда и возможность предсказания значения У по значению X должна быть равна единице. А отечественный коэффициент равен нулю. Тут мы замечаем обстановку, в то время, когда коэффициент не хорошо ведет себя в нуле. Запомните эту фразу. Вы станете видеться с подобными фразами и при вторых коэффициентов. Дабы исключить неверную интерпретацию нулевого значения, нужно по одномерному распределению уточнить, не сосредоточены ли данные лишь в одном столбце. Таковой случай кроме этого не видится в социологической практике.

Представляется серьёзным подчернуть, что в настоящих исследованиях значения коэффициента Гуттмана малы и применять их необходимо равно как и многие другие коэффициенты в сравнительном контексте, к примеру, для ранжирования как бы свободных между собой показателей по степени их влияния на некий особенно ответственный для исследователя показатель, обозначаемый как целевой, зависимый. В случае если для того чтобы нет, то направленные коэффициенты «лямбда» применять не имеет особенного смысла.

Лекция 4: Меры связи номинальных показателей в таблицах сопряженности произвольного размера


Также читать:

Понравилась статья? Поделиться с друзьями: