Измерение средней тенденции и дисперсии

Для описания распределения показателей по значениям одной переменной применяют два типа статистических процедур. Первый – измерение средней арифметической величины показателя – оказывает помощь нам распознать самые типичные значения, одно либо пара, каковые наилучшим методом воображают целый комплекс показателей по данной переменной. Вообразите, что нам сообщили, словно бы так называемый средний американец – это “светло синий воротничок”, взявший среднее образование и совместно со своей женой имеющий в среднем 1,7 ребенка. Ясно, что не каждый американец отвечает этим требованиям, но в случае если кинуть на американцев этакий неспециализированный взор, то приведенный комплект черт может оказаться очень родным к тому неспециализированному впечатлению, которое у нас сложится. Вот как раз такое представление об усредненном либо обычном случае мы приобретаем при измерении средней арифметической величины. И именно это измерение было использовано при обнаружении самые типичных особенностей американцев.

Но, как уже отмечалось, не все американцы владеют такими чертями. Многие являются “белыми воротничками”, или экспертами, или кроме того безработными, кое-какие закончили лишь начальную школу, у других – более высокое образование, иные имеют 10 либо 20 детей, другие же не женаты и детей не имеют. Иными словами, “обычный” американец воображает только среднюю тенденцию в совокупности, но не отражает совершенно верно любой отдельный показатель. Ну, а потому, что таковой обычный показатель отыскан, мы вправе задать вопросы:

“Как это типично? Как верно эти усредненные показатели отражают распределение особенностей всех единиц массива по данной переменной?” Мы ответим на них, в случае если используем второй тип статистических расчетов – дисперсию. Измеряя дисперсию, мы определим, как колеблется (варьирует) отклонение от того среднего значения, которое мы нашли, в каких случаях возможно быть уверенным, что отечественное среднее значимо, и не есть ли отклонение [c.394]настолько громадным, что самый типичный показатель в действительности не есть репрезентативным для всей совокупности.

Вследствие этого появляется ответственная неприятность, которую дует обсудить, перед тем как двигаться куда-либо дальше. Статистика – это могучее средство анализа; она возможно сообщить о отечественных данных значительно больше, чем возможно распознать любым вторым методом. Но сама по себе статистика бездумна. Возможно произвести каждые статистические счеты на любом массиве данных и, казалось бы, выжать из данных все до последней капли. Но многие из этих “результатов” по двум обстоятельствам могут быть тщетными. Первую обстоятельство мы уже обсуждали, логика ее станет яснее по мере предстоящего продвижения. Говоря несложнее, уровень сложности анализа может превосходить уровень сложности, заложенный в данных. В случае если выбранный нами способ требует сложить две цифры, а эти основаны на номинальной шкале, для которой неприемлема сама концепция сложения, то вообще-то механически возможно сложить значения двух кодов, но итог этого окажется ненужным. Так, в случае если код 1 воображает рабочих – “светло синий воротничков”, код 2 – “белых воротничков”, а 3 – экспертов, то мы, само собой разумеется, можем к ому прибавить два и взять три, но неужто мы вправду будем утверждать, что один рабочий – “светло синий воротничок” плюс один рабочий – “белый воротничок” равны одному эксперту? Само собой разумеется, нет.

Вторая обстоятельство, по которой результаты статистические расчетов могут быть незначимыми, –это то, что одна статистика сама по себе довольно часто не имеет возможности представить всю картину полностью. В случае если единственный самый типичный уровень образования американцев – это школа , но лишь 25% всего населения достигли этого уровня и остановились на нем, то как большое количество в конечном итоге может сообщить нам это среднее значение? Не так уж большое количество. И большое количество ли вы понимаете людей, каковые вправду имеют 1,7 ребенка? Так, не смотря на то, что мы можем совершенно верно подсчитать и представить эти цифры, нельзя останавливаться лишь на них. Каждое измерение средней арифметической должно быть взвешено либо оценено сопутствующим измерением дисперсии. И еще (мы обсудим это позднее): неизменно, в то время, когда мы имеем дело с [c.395]расчетами, каждое измерение связей между двумя переменными направляться сопровождать измерением статистической значимости, т.е. направляться обозначить, как совершенно верно отысканные размеры воображают значительные связи между данными переменными. Так, статистические расчеты должны не только соответствовать уровню измерений данных, но и быть значительно значимыми, в случае если мы желаем получить от них максимум пользы.

Любое измерение дисперсии и средней тенденции основано на неспециализированной оценке градаций переменных и единиц массива, которая именуется частотным распределением. Частотное распределение – это упорядоченный подсчет количества показателей по каждому значению какой-либо переменной. Представьте, к примеру, что мы задали 100 респондентам вопрос об их занятии на данный момент и после этого распределили их ответы по типам. Тогда частотное распределение для переменной “тип занятий” может смотреться так, как это продемонстрировано в табл. 14.1.

Таблица 14.1.

Алгебра 8 класс (Урок№50 — среднее и Дисперсия квадратичное отклонение.)


Также читать:

Понравилась статья? Поделиться с друзьями: