Характеристики формы распределения.

Тема 6. Анализ последовательностей распределения

Показатели вариации.

Средняя величина дает обобщающую чёрта всей совокупности изучаемого явления. Но два последовательности распределения, имеющих однообразную среднюю арифметическую величину, смогут существенно различаться друг от друга по степени колеблемости (вариации) величины изучаемого показателя. В случае если личные значения показателя последовательности слабо отличается друг от друга, то средняя арифметическая хватит показательной чёртом данной совокупности. В случае если же последовательность распределения характеризуется большим рассеиванием личных значений показателя, то средняя арифметическая будет ненадежной чёртом данной совокупности и ее использование на практике будет ограничено.

Значение показателей вариации содержится в следующем:

— показатели вариации дополняют средние величины, за которыми прячутся личные значения показателей вариационного последовательности;

— показатели вариации характеризуют степень однородности статистической совокупности по изучаемому показателю;

— показатели вариации характеризуют границы колеблемости показателя;

— соотношение показателей вариации характеризует связь между показателями.

Для измерения вариации показателя в рядах распределения используются разные безотносительные и относительные показатели. В статистике значительно чаще используются следующие показатели (меры) вариации: размах вариации, среднее линейное отклонение, дисперсия, среднее коэффициент вариации и квадратическое отклонение.

Разглядим детально любой из перечисленных показателей вариации.

Размах вариации (размах колебаний) является разностью между большим и минимальным значениями показателя и определяется по формуле:

(6.1)

где R – размах вариации;

xmax – большое значение показателя;

хmin – минимальное значение показателя.

Пример. Наблюдения говорят о том, что скорость перемещения автомобилей находится в диапазоне 20-90 км/ч., грузовиков – в пределах 20-80 км/ч., маршрутных автобусов – 20-60 км/ч., автобусов междугородних сообщений – 20-90 км/ч. Определим размах вариации скоростей этих видов транспорта. Расчет представлен в таблице 13.

Таблица 6.1

Скорости перемещения транспортных средств

Вид транспорта Скорость, км/ч. Скорость км/ч. Размах вариации
автомобили R=90-20=70 км\ч.
грузовики R=80-20=60 км\ч.
Маршрутные автобусы R=60-20=40 км\ч.
Междугородние автобусы R=90-20=70 км\ч.

Абсолютным преимуществом этого показателя есть простота его расчета, исходя из этого он не редко употребляется и в технике и в экономике. Но размах вариации зависит от величины лишь крайних значений показателя, что делает в известной мере случайной его величину. Исходя из этого его целесообразно использовать при изучении достаточно однородных статистических совокупностей.

Более надежный показатель – средний размах вариации, вычисляемый как средняя арифметическая из последовательности размахов, взятых в следствии обработки равных серий наблюдений. Таким показателем, пользуются, к примеру, при контроле качества продукции.

Среднее линейное отклонение определяется как средняя арифметическая личных безотносительных отклонений значений показателя от его среднего значения.

Личные значения показателя в статистической совокупности отклоняются от его средней величины в ту либо иную сторону. Отыщем среднюю меру отклонения каждого значения показателя от его средней величины. Обозначим значения варьирующего показателя у отдельных единиц совокупности через , где n – количество (число) единиц совокупности.

Вычитая из каждого значения показателя его среднюю величину возьмём:

; ; … (6.2)

Так как алгебраическая сумма (сумма с учетом символа (±) размеров) отклонений личных значений показателя от средней арифметической (в соответствии с нулевому свойству) неизменно равна нулю, то для расчета среднего линейного отклонения употребляется арифметическая сумма (сумма модулей размеров) отклонений, т.е. суммируются безотносительные значения личных отклонений значений показателя независимо от символа.

Среднее линейное отклонение вычисляется для первичных, несгруппированных данных:

(6.3)

Для сгруппированных данных (интервальный последовательность):

(6.4)

где хi – личное значение i-гo показателя;

– центральное значение показателя в i-ом промежутке;

– среднее значение показателя;

п — число единиц статистической совокупности;

fi – количество показателей в i-ом промежутке;

m – количество промежутков в интервальном вариационном последовательности.

Пример. Совершим расчет среднего линейного отклонения сменной выработки токарей механического цеха, информацию о которой представлены в таблице 6.2.

Таблица 6.2

Сменная выработка токарей механического цеха завода

Количество подробностей, обрабатываемых в смену одним рабочим, шт. (х) Число рабочих (f) х·f
ИТОГО:

Вычисляем среднюю арифметическую:

Тогда среднее линейное отклонение составит:

Это указывает, что в среднем сменная выработка каждого рабочего в изучаемой совокупности отклонялась от средней сменной выработки в целом по цеху на 0,75.

Среднее линейное отклонение – число неизменно именованное. Его размерность соответствует размерности варьирующего показателя.

интерпретации результатов и Простота расчёта составляют хорошие стороны данного показателя. Но в следствии абстрагирования от символа личных отклонений, появляются трудности в применении математических способов анализа вариации. Математические особенности модулей «нехорошие»: их нельзя поставить в соответствие с каким-либо вероятностным законом, среди них и с обычным распределением, чаще всего ветречающимся в экономике, в технике, в жизни. По данной причине среднее линейное отклонение на данный момент применяют редко, но применяют. К примеру, для оценки пряжи толщины и однородности нитей в текстильной индустрии.

Среднее квадратическое отклонение определяется как корень квадратный из среднего квадратов отклонений личных значений показателя от средней арифметической и рассчитывается по следующим формулам:

для не сгруппированных данных:

(6.5)

для сгруппированных данных:

(6.6)

для интервального последовательности:

(6.7)

Возведение личных отклонений в последующее извлечение и квадрат квадратного корня позвано, как уже говорилось, тем, что суммирование отклонений в первой степени ведет к нулевому результату.

Среднее квадратическое отклонение есть общепринятым показателем вариации: при его определении принимаются в расчет все отклонения значений варьирующего показателя от среднего. Проиллюстрируем расчет среднего квадратического отклонения для ранжированного и интервального вариационных последовательностей.

Пример. Пускай испытываются шесть лампочек на продолжение горения. Результаты опробования представлены в табл. 6.3 (дискретный вариационный последовательность).

Таблица 6.3

Результаты опробований лампочек

Порядковый номер опробования Длительность горения лампочки, час (х,)
+20
-25
+5
-10
+10
ИТОГО:

Вычислим среднюю арифметическую и среднее квадратическое отклонение:

Это указывает, что в среднем длительность горения лампочки в изучаемой совокупности отклонялась от средней длительности в целом по совокупности на 14,3 часа.

Пример. Вычислим среднее квадратическое отклонение срока обращения облигаций. Данные для расчета и промежуточные вычисления представлены в табл. 6.4 (интервальный вариационный последовательность).

Вычислим среднюю арифметическую величину срока обращения акций и среднее квадратическое отклонение:

;

Таблица 6.4

Срок обращения облигаций

Срок обращения облигаций, мес (х) Количество облигаций, шт ( f )
до 2 – 4,6 21,16 317,4
2 – 4 – 2,6 6,76 87,88
4 – 6 – 0,6 0,36 10,44
6 – 8 1,4 1,96 43,12
8 – 10 3,4 11,56 138,72
10 и более 5,4 29,16 262,44
ИТОГО: 71,40 860,00

В научной статистике обширно употребляется показатель вариации, именуемый дисперсией. Дисперсия – это средний квадрат отклонений личных значений показателя от средней арифметической.

Дисперсия вычисляется по следующим формулам.

Для не сгруппированных данных:

. (6.8)

Для сгруппированных данных (дискретный последовательность):

. (6.9)

Для интервального последовательности:

. (6.10)

На дисперсии основаны фактически все способы математической статистики.

среднее и Дисперсия квадратическое отклонение – самый обширно используемые показатели вариации. Разъясняется это тем, что они входят в большая часть теорем теории возможности, служащих фундаментом математической статистики. Помимо этого, дисперсия возможно разложена на составные элементы, разрешающие оценить действие разных факторов, обуславливающих вариацию показателя.

Рассмотренные ранее показатели вариации, за исключением дисперсии, выражались в единицах измерения варьирующего показателя. Так, к примеру, среднее квадратическое отклонение урожайности пшеницы измеряется в центнерах. Так как среднеквадратическое отклонение – число именованное, то оно некомфортно для сопоставления вариации разных показателей. К примеру, вычислив среднее квадратическое заработной производительности платы и отклонение работы рабочих, нереально выяснить, вариация какого именно показателя больше, т.к в первом случае она измеряется в единицах продукции (подробностях), во втором – в гривнях.

Для сравнения вариации различных показателей чаще всего используется показатель относительной колеблемости – коэффициент вариации. Его применяют не только для сравнительной оценки вариации, но и для чёрта однородности статистической совокупности. Статистическая совокупность считается однородной, в случае если коэффициент вариации не превышает 33% (для распределений, родных к обычному закону).

Принцип построения коэффициентов вариации таков:

(6.11)

Линейный коэффициент вариации Квадратический коэффициент вариации Коэффициент
(6.12)

осцилляции

Значительно чаще на практике употребляется квадратический коэффициент вариации.

Посредством коэффициента вариации возможно сравнивать размеры одного показателя в нескольких совокупностях. Так, к примеру, посредством коэффициента вариации возможно сравнивать вариацию срока работы станков на разных фирмах, веса населения и вариацию роста в разных регионах страны.

Пример. Разглядим коэффициенты вариации срока работы электролампочек, производимых на трех фабриках. Данные представлены в табл. 6.5.

Таблица 6.5

Срок работы электролампочек

Номер завода Средняя длительность горения лампочек, ч., (х) , %
-100 10,20
+ 100 8,17
9,07
ИТОГО-

Вычислим среднюю арифметическую срока горения лампочек:

.

Вычислим среднее квадратическое отклонение:

.

Вычислим коэффициент вариации для каждого завода и занесем данные в таблицу. самый низкий коэффициент вариации у электролампочек, производимых на заводе № 2, что говорит о громадной однородности его продукции (в этом случае, однородности качества электролампочек).

Характеристики формы распределения.

Для получения приблизительного представления о форме распределения строят графики распределения (полигон и гистограмму). В практике статистических изучений приходится видеться с самими разными распределениями. Однородные совокупности характеризуются в большинстве случаев, одновершинными распределениями. Многовершинность говорит о неоднородности изучаемой совокупности. В этом случае нужна перегруппировка данных с целью выделения более однородных групп.

Выяснение характера распределения предполагает оценку степени его однородности, и исчисление эксцесса и показателей асимметрии. В симметричном распределении , а чем заметнее асимметрия, тем больше отклонение между чертями центра распределения .

Стандартное отклонение именуется коэффициентом асимметрии:

. (6.13)

При правосторонней асимметрии As 0, левосторонней – As 0. В случае если
As 0,25, считается, что ассиметрия низкая, в случае если As ? 0,5 – средняя, а при As 0,5 – высокая.

Рис. 6.1. Симметрия распределения

Оценивание коэффициента асимметрии кроме этого может производиться на базе центрального момента распределения и вычисляется по формуле:

(6.14)

где ?3 – центральный момент третьего порядка: .

Алгебраически центральный момент распределения – это средняя арифметическая k-й степени отклонения личных значений показателя от средней:

(6.15)

Разумеется, что момент второго порядка – это дисперсия, которая характеризует вариацию, моменты 3-го и 4-го порядков характеризуют соответственно ассиметрию и эксцесс.

Эксцесс распределения – степень сосредоточенности элементов совокупности около центра распределения. Показатель эксцесса (островершинности) рассчитывается по формуле:

, (6.16)

где ?4 – центральный момент четвертого порядка .

Рис. 6.2. Эксцесс распределения

Эксцесс возможно хорошим и отрицательным. У островершинных распределений показатель эксцесса имеет хороший символ, а у плосковершинных – отрицательный символ. Предельным значением отрицательного эксцесса есть значение Ех = – 2; величина хорошего эксцесса есть величиной нескончаемой. В обычном распределении и исходя из этого .

Характеристики формы распределения: показатели эксцесса и асимметрии


Также читать:

Понравилась статья? Поделиться с друзьями: