Измерения для интервальных переменных

Интервальные эти, непременно, предоставляют нам наиболее все данные, включая категоризацию, установление и ранжирование промежутков. Интервальные значения смогут быть подвержены любым арифметическим манипуляциям. Следовательно, приступая к исчислению дисперсии и средней тенденции для интервальных данных, мы можем и должны принять эти сведенья о дополнительных возможностях во внимание.

Основной единицей для интервальных данных есть среднее геометрическое, определяющее место средней точки в распределении с позиций как количества показателей от каждого финиша распределения до данной точки, так и расстояние между ней и каждым показателем. Среднее геометрическое распределения – это то, что многие люди в большинстве случаев связывают с термином “среднее арифметическое”.[c.401]

Давайте проиллюстрируем нахождение среднего геометрического на примере рис. 14.2. В случае если все показатели распределения имеют равные веса, и если они расположены на оси на равных промежутках так, что показатели с предельными значениями самый удалены от средней точки в том либо другом направлении, а случаи с равными значениями расположены на равноудаленных точках оси, то точка среднего геометрического будет находится в центре оси, где сумма интервалов и значений одной стороны уравновешивается суммой интервалов и значений второй. Как светло из рисунка, и веса (количество показателей) и промежутки (крайние значения) ответственны для определения среднего геометрического.

Среднее геометрическое распределения, обозначаемое , вычисляется по следующей формуле:

,

где Xi – значение каждого отдельного случая;
N – количество случаев;
– символ суммы всех отдельных случаев от 1 до N.

Обратите внимание, что в подсчете употребляются деление и сложение, два арифметических действия, произведенные с самими значениями (что принципиально превосходно от легко количества случаев с данным значением) с подсчетом как всех значений, так и промежутков. Это и имеется те манипуляционные возможности, каковые отличают интервальные эти от данных более низких уровней измерения.

Увидьте, но, еще, что, как видно из рис. 14.2г, как раз вследствие того что среднее геометрическое чувствительно к величине промежутков, оно зависит от кренов в распределении, каковые вызываются наличием одного либо нескольких предельных показателей. Иными словами, маленькое количество случаев с предельными значениями может сделать значение среднего геометрического меньше либо больше, чем реально репрезентативное. Давайте посмотрим, как это может оказаться.[c.402]

Заберём группу из 11 человек, 10 из которых получают 10.000 долларов в год, а один – 1 млн. Значение среднего геометрического дохода для данной группы – 100.000 долларов.

Но 10 из 11 участников группы получают, по сути дела, десятую часть этого количества. Так, среднее геометрическое, не смотря на то, что и совершенно верно подсчитанное, однако не так репрезентативно, как, скажем, медиана, которая в другом случае равна 10.000 долларов. По большому счету говоря, статистические процедуры с меньшими возможностями (предназначенные для более низких уровней измерения) неизменно возможно применять в анализе данных, и, не смотря на то, что они теряют некоторые сведенья (к примеру, расстояние до предельного значения, как тут), время от времени с их помощью возможно взять более значимые результаты. Поспешим отметить, но, что обратное неверно; статистические процедуры с большим уровнем возможностей не имеют ни мельчайшей ценности для шкал низких уровней.

Чаще всего употребляемый метод измерения дисперсии для интервальных данных, стандартное отклонение, из всех видов статистических процедур, каковые мы используем, возможно, один из увлекательнейших. На первый взгляд может показаться, что в случае если мы желаем выяснить, как по отношению к распределению в целом типично среднее геометрическое, то все, что необходимо сделать, – это измерить расстояние от его точки до каждого случая, сложить их и поделить на количество случаев N. Иными словами, мы подсчитаем среднее геометрическое расстояний около среднего геометрического распределения по формуле:

Чем больше дисперсия для данного распределения, тем менее типично среднее геометрическое, и, чем меньше дисперсия, тем более типично среднее геометрическое.[c.403]

Но в случае если мы попытаемся сделать все это на примере, скажем, рис. 14.2в, появятся кое-какие неприятности. Применив формулу к этому случаю, мы возьмём:

Кроме того при распределения с таким сильным отклонением, как в примере с доходами, мы возьмём:

И в любом случае среднего геометрического для любого распределения итог будет тот же. Обстоятельство несложна. Мы, по сути дела, выяснили среднее геометрическое как такую точку, где все веса и промежутки уравновешены, точку либо значение, довольно которых все другое сбалансировано. Следовательно, при подсчете среднего геометрического вряд ли стоит удивляться, что мы возьмём [c.404]как раз то, что предполагалось. Однако искушение измерить дисперсию методом измерения близости показателей к либо удаления их от среднего геометрического сохраняет собственную притягательность. Введем понятие стандартного отклонения.

Стандартное отклонение (s) есть тем математическим инструментом, что может оказать помощь выполнить вашу задачу. По сути дела, это процедура, которая сводит на нет свойства разнонаправленных промежутков уравновешивать друг друга методом несложного возведения в квадрат утих промежутков (и избавляясь так от отрицательных значений), измерения разброса квадратов промежутков около среднего геометрического и после этого извлечения из результата квадратного корня, с тем дабы возвратиться к начальным единицам промежутков. Формула, по которой все это вычисляется, напоминает прошлую, акромe возведения в извлечения и квадрат квадратного корня. Формула эта такова:

где Xi – значение каждого отдельного случая;
– среднее геометрическое;
N – количество случаев;
– символ суммы всех отдельных случаев от 1 до N.

Так, для примера на рис. 14.2в

Она выражена в тех же единицах, что и данные. В случае если переменные измеряются в одних и тех же либо единицах, то стандартное отклонение может базой для выяснения репрезентативности средних геометрических; чем больше стандартное отклонение, ее репрезентативно среднее геометрическое. Но в случае если единицы принципиально хороши либо в случае если анализируется одна переменная, интерпретация стандартного отклонения уже не столь несложна.

Существует одно исключение из этого: переменные, чье [c.405]распределение близко к обычному, т.е. такие, у которых существует единственная мода в самом центре распределения, а частоты симметрично убывают по направлениям к предельным значениям (графическое изображение обычного распределения, с которым вы, предположительно, прекрасно привычны, – это легко колоколообразная кривая). Известно (из рассуждений, каковые не входят в рамки отечественного беседы), что в таких случаях 68,3% всех случаев лежат в пределах одного стандартного отклонения, от среднего геометрического ( ± s), 95,5% – в пределах двух стандартных отклонений от среднего геометрического ( ± 2s) и 99,7% – в пределах трех стандартных отклонений от среднего геометрического ( ± 3s). Практически при таких распределений мы для любой точки можем выяснить, на какое количество стандартных отклонений ниже либо выше среднего геометрического она находится, и после этого применять эти сведенья для выяснения относительного положения двух показателей в одной переменной либо, напротив, относительного значения двух переменных для одного и того же показателя. Разрешает это сделать нам стандартная оценка, (z), которая вычисляется по следующей формуле:

Представьте, что мы располагаем данными, к примеру, по затратам на образование на одного человека в каждом штате, количеству трудящихся учителей на 1000 студентов в каждом штате и количеству награжденных выпускников школы на 100.000 населения в каждом штате в определенном году и что значения этих переменных по штатам распределяются по кривой, близкой к обычной. Представьте после этого, что мы желаем применять эти сведенья для изучения политики в области образования в Аризоне и Виргинии. Мы сперва подсчитаем среднее геометрическое ( ) и стандартное отклонение (s) для каждой переменной по всем 50 штатам, после этого определим соответствующие стандартные оценки (z) для каждой переменной по двум нужным нам штатам. Результатом будут два комплекта значений в стандартных единицах (уже не в долларах, количестве документов и учителей, а числом стандартных отклонений от среднего [c.406]геометрического), каковые смогут быть использованы для определения индексов политики в области образования, для выяснения относительной позиции Аризоны и Виргинии среди вторых штатов либо для стандартизации при необходимости cравнения принципиально хороших измерений. Так, при применении стандартного подсчета стандартное отклонение может оказаться весьма полезным.[c.407]

ЗАКЛЮЧЕНИЕ

В данной главе мы остановились на статистических процедурах, каковые обрисовывают распределения в рамках одной переменной. Потому, что эта статистика характеризует отдельные переменные, ее довольно часто именуют одномерной. Мы видели, что разные одномерные статистические процедуры подходят для переменных разного уровня измерений – номинального, порядкового и интервального. В следующей главе мы рассмотримдвумерную статистику, т.е. такую, которая включает связи двух переменных.[c.407]

Дополнительная литература

Если вы захотите глубже изучить статистику, см. литературу к гл. 16. на данный момент же будет нужнее начать с книг, каковые облегчат использование диагностики и окажут помощь овладеть некоторыми фундаментальными ее правилами. Мы предлагаем хорошую и, к тому же, радостную кн.: Darrel H. How to Lie with Statistics. – N.Y.: Norton, 1954. Даррел определяет статистику как “статистикуляцию”. Значительно более полное и легко читающееся издание по статистике: Schutte J.G. Everything You Always Wanted to Know About Elementary Statistics (but were afraid to Englewood Cliffs (NJ.): Prentice-Hall, 1977.[c.407]

Как начинающим повысить скорость в беге. Как составлять замысел на 7 дней


Также читать:

Понравилась статья? Поделиться с друзьями: