Этап vi. проверка гипотезы о нормальном законе распределения

ЛАБОРАТОРНЫЙ ПРАКТИКУМ

ПО

МАТЕМАТИЧЕСКОЙ

СТАТИСТИКЕ

методические указания

и варианты личных заданий

для исполнения расчётно-графической

работы

часть 1

г. Тюмень, 2012

Предисловие

В сборнике находятся варианты и методические указания лабораторной работы по теме: «Первичная обработка результатов наблюдения способом математической статистики. Оценка параметров «обычного» распределения. Проверка догадки о обычном законе распределения».

Цель исполнения лабораторной работы – привить студентам навыки независимой обработки эмпирически взятых данных посредством главных способов математической статистики. Привить навыки по овладению способом проверки статистической догадки о обычном законе распределения изучаемой случайной величины.

Содержание лабораторного практикума снабжает независимое исполнение расчётно-графической работы.

Описание лабораторной работы включает краткие план выполнения и теоретические сведения работ:

  • метод вычисления;
  • пример исполнения работы;
  • контрольные вопросы;
  • варианты заданий.

Лабораторный практикум содержит 50 вариантов и гарантирует индивидуальность его исполнения.

Наличие метода разрешает все расчёты создавать как в «ручном» режиме так и посредством ЭВМ.

Рекомендуется для инженерных, экономических, биологических и агрономических профессий.

Лабораторная работа №1

Первичная обработка результатов наблюдения способом математической статистики. Оценка параметров «обычного» распределения. Проверка догадки о обычном законе распределения случайной величины.

Цель работы:Привить навыки первичной обработки эмпирических данных посредством способов математической статистики. Привить навыки по овладению способом проверки статистической догадки о обычном законе распределения изучаемой случайной величины.

Содержание работы:

1.Группировка данных в представление и вариационный ряд в виде эмпирической функции распределения.

2.Графическое изображение эмпирической функции и вариационного ряда распределения.

3.Вычисление главных числовых черт выборочной совокупности.

4.Определение границ подлинных значений числовых черт, изучаемой случайной величины с заданной надёжностью.

5. Содержательная интерпретация результатов первичной обработки по условию задачи.

6. Проверка догадки о обычном законе распределения посредством:

— критерия Пирсона,

— критерия Романовского,

— критерия Ястремского,

— критерия Колмогорова,

— приближенного способа с применением .

Форма отчета:

1. Представление работы по указанному в методике примеру.

2.Независимое изучение теоретического материала посредством предлагаемых контрольных вопросов.

3.Устное собеседование по работе, сдача зачета.

§ 1.1 Краткие план и теоретические сведения

Исполнения работы

Изучение особенностей случайных размеров способом математической статистики основано на первичной обработке результатов наблюдений, выраженных в числовой форме.

Целью первичной обработки есть представление первичной числовой информации в более обозримой, сжатой форме, и получение сведений об главных закономерностях изучаемой совокупности случайных размеров.

В математической статистике различают главную совокупность и выборочную.

Под главной совокупностью понимается все мыслимое множество случайных объектов, владеющих общностью некоего, изучаемого в данном изучении, показателя. Это множество, в большинстве случаев, счетное.

Выборочная совокупность (выборка)- эта часть главной совокупности, которая практически изучается.

Чтобы по выборке возможно хватало с уверенностью делать выводы о особенностях главной совокупности она должна быть репрезентативной, т.е. достаточной по численности, случайной по отбору с соблюдением равной возможности каждого элемента главной совокупности попасть в выборку.

Теоретической базой выборочного способа есть теорема Чебышева.

Теорема:с возможностью, сколь угодно близкой к достоверности возможно утверждать, что при большом числе наблюдений, ограниченной дисперсии главной совокупности попарно свободных случайных размеров, разность между средним арифметическим и средним арифметическим их математических ожиданий будет сколь угодно малой, т.е.

в частности ,

где — средняя для выборочной совокупности;

-средняя для главной совокупности;

-как угодно малое положительное число.

Итоги эмпирических наблюдений являются несложный статистический последовательность- таблицу числовых значений изучаемой случайной величины. Как мы знаем, что, в случае если обнаружить числовые характеристики, предварительно сгруппировав полученные эти, то их значения будут ближе доходить к подлинным значениям подобных черт главной совокупности.

проверка гипотезы результатов и Первичная обработка наблюдений складываются из нескольких этапов. Разглядим содержание каждого из них.

Этап I. Группировка данных в представление и вариационный ряд его в виде функции распределения.

Чтобы статистику представить в виде вариационного последовательности с равноотстоящими вариантами нужно:

1.В исходной таблице эмпирических разрешённых найти мельчайшее ( ) и громаднейшее ( ) значения.

2.Выяснить размах варьирования:

3. Наметить число промежутков группировки. Имея в виду, что выделением многочисленного числа групп возможно затушевать неспециализированную картину распределения, малое же число не разрешит распознать характерную изюминку изучаемой случайной величины. Исходя из опыта рекомендуется выделять от 5 до 20 групп так, дабы любая несколько была достаточно наполнена значениями вариант. Возможно кроме этого воспользоваться формулами:

где s-число групп, n-количество выборки.

4. Выяснить длину промежутка

.

В случае если вычисленное отношение – число иррациональное, то его округляют до эргономичного целого значения.

5. Записать промежутки группировок и расположить их в порядке возрастания границ

, ,………., ,

где — нижняя граница первого промежутка. За берется эргономичное “круглое” число не большее , верхняя граница последнего промежутка должна быть не меньше .Это делается чтобы промежутки содержали в себе исходные значения случайной величины.

6. Разнести данные по промежуткам группировок, т.е. подсчитать по исходной таблице число значений случайной величины, попадающих в указанные промежутки. В случае если кое-какие значения совпадают с границами промежутков, то их относят или лишь к прошлому, или лишь к последующему промежутку.

Записать интервальный последовательность относительных частот и частот.

7. От интервального последовательности перейти к дискретному. Для этого любой промежуток заменить его средним значением, покинув частоты и относительные частоты без трансформации.

8. Записать эмпирическую функцию распределения.

где — число вариант, значения которых меньше чем ;

n — число всех значений, количество выборки.

………………………..

F*(x) определяет относительную частоту события (X

Замечание №1. Промежутки необязательно брать равными по длине. На участках, где значения находятся гуще, эргономичнее брать более небольшие маленькие промежутки, а в том месте где реже — более большой.

Замечание №2. Появление “граничных” значений нежелательно, это приводит к смещению эмпирического распределения от его подлинного положения на числовой оси влево, или вправо, выбирая границы, регулирования длину промежутка, направляться этого избегать.

Замечание №3 В случае если для некоторых значений взяты “нулевые”, или малые значения частот , то нужно перегруппировать эти, укрупняя промежутки (увеличивая ход ).

Этап II. Графическое эмпирической функции и изображения ряда распределения.

Графически интервальный вариационный последовательность изображается или в виде гистограммы частот – ступенчатой фигуры, складывающейся из прямоугольников, основанием которых помогают промежутки группировки, а высоты равны отношению частоты к длине промежутка , или в виде гистограммы относительных частот, в то время, когда высоты прямоугольников равны отношению относительной частоты к длине промежутка группировки .

Дискретный вариационный последовательность графически изображается в виде полигона частот либо относительных частот.

Полигон частот – это ломаная линия, отрезки которой соединяют точки с координатами ( ).

Полигон относительных частот – это ломанная линия, отрезки которой соединяются точками с координатами ( ).

Эмпирическая функция распределения графически изображается в виде линии, изменяющейся скачкообразно. На оси абсцисс откладывается значения промежутков, на оси ординат соответствующие им возможности (значения функции), вычисляемые по формуле , где .

Скачки наблюдаются при переходе от одного промежутка к второму.

Графическое изображение вариационных эмпирической функции и рядов распределения лучше уяснить на конкретном примере в разделе “Пример исполнения задания”.

Этап III. Вычисление числовых черт.

Вычисление числовых черт осуществляются по следующим формулам:

1. Среднее арифметическое

.

2. Дисперсия вычисляется или по определению

или по формуле , где и — начальные эмпирические моменты первого и второго порядков.

3. Среднее квадратическое отклонение

.

4. Исправленная дисперсия

.

5. Исправленное среднее квадратическое отклонение

.

6. Коэффициент асимметрии

,

где — центральный эмпирический момент третьего порядка, он вычисляется или по определению

,

или по формуле

,

где — начальные эмпирические моменты первого, второго и третьего порядков.

7. Коэффициент эксцесса

,

где — центральный эмпирический момент четвертого порядка. Он вычисляется или по определению

или по формуле ,

,

8.Коэффициент вариации

,

( , )

Замечание 1: Так как все числовые характеристики выражаются через , то эргономичнее сначала вычислить числовые значения , а после этого значения числовых черт.

Замечание 2: Для упрощения расчетов, если они выполняются “вручную” эргономичнее перейти от данных значений вариант к условиям по формуле

,

где h – протяженность промежутка группировки,

С – фальшивый нуль.

Значительно чаще в качестве фальшивого нуля принимается или варианта, находящаяся в середине вариационного последовательности, или мода (варианта , имеющая громаднейшую частоту), или любое второе число, упрощающее расчеты.

В случае если за принять какое — или значение , то соответствующая ему условная варианта будет равна нулю, а слева и справа от нуля будут размешаться соответственно значения 1, 2, 3, 4 и т.д.

В случае если, к примеру, , то вариационный последовательность в условных вариантах примет вид

-2 -1

Промежуточные расчеты при вычислении числовых черт эргономичнее оформлять в виде таблицы. После этого вычисляют условные эмпирические моменты по формуле . По окончании вычисления числовых черт в условных вариантах нужно перейти к начальным значениям вариант по формулам:

Этап IV. Определение границ подлинных значений числовых черт изучаемой величины с заданной надежностью.

Числовые характеристики, вычисленные по случайной выборке из главной совокупности, только приближенно характеризуют подлинные значения подобных черт изучаемой главной совокупности. Исходя из этого появляется вопрос о надежности, с которой возможно принять вычисленные значения и о границах допустимых значений. Частично эти вопросы решаются методом нахождения конфиденциальных (надежностных) промежутков для главных числовых черт.

Надежностный промежуток для главной средней имеет форму:

либо ,

где — среднее выборочное

n – количество выборки

, в случае если громадная выборка ( ),

t – значение довода функции Лапласа, при котором она равна , t – находится по таблицам значений функции Лапласа из условия

,

где — возможность суждений, именуемая надежностью. Она выбирается самим исследователем. Значения =0.95, в большинстве случаев, считается достаточным для большинства изучений. Надежностный промежуток с возможностью содержит в себе главную среднюю.

Замечание. В случае если выборка мелка (n

где S – исправленное выборочное среднеквадратическое отклонение, — число, забранное из таблицы значений по количеству выборки n и надежности .

При громадных n результаты нахождения надежноcтного промежутка двумя указанными методами фактически неразличимы.

Надежностный промежуток для среднеквадратического отклонения имеет форму

,

т.е. определяется выражением •q либо, в случае если левая часть отрицательна, то ее отбрасывают и промежуток примет вид

,

где S — исправленное выборочное среднее квадратическое отклонение,

q – табличное значение критических точек , оно зависит от количества выборки n и заданной надежности .

Этап V. Содержательная интерпретация результатов первичной обработки данных по условию задачи.

Итогом первичной обработки данных помогает содержательная интерпретация результатов произведенных вычислений.

Арифметическое среднее, вычисленное по выборочным данным, представляет собой обобщенную чёрта всей совокупности значений в целом. Значение — являясь как бы точкой сгущения значений, характеризует центральное положение вероятных значений случайной величины.

Доверительный промежуток показывает на то, что с возможностью , главная средняя изучаемой случайной величины заключена в отысканном промежутке, либо, что этот промежуток с надежностью содержит в себе подлинное среднее значение главной совокупности .

Среднее квадратическое отклонение является показателем, что дает представление о самая вероятной средней неточности отдельного, единичного наблюдения, забранного из данной совокупности.

Главные значения, ядро вариационного последовательности содержится в промежутке

, либо .

Отклонение от , превосходящее по модулю вероятны, но возможность их значительно уменьшается по мере удаления от , .

Надежностный промежуток с возможностью содержит в себе значение главного среднего квадратического отклонения.

Коэффициент асимметрии — говорит о нарушении симметрии, наличие скоса.

В случае если , то скос отмечается справа, в случае если , то слева, в случае если , то распределение симметричное.

Коэффициент эксцесса — говорит о характере вершины распределения.

В случае если , то распределение островершинное, это показывает, что значения показателя не существенно разбросаны около среднего значения. В случае если , то распределение пологое, это показывает, что значения показателя существенно разбросаны около среднего значения. В случае если , то распределение сходится со стандартным обычным.

Коэффициент вариации V – стандартное отклонение, выраженное в процентах к средней арифметической данной совокупности. Он есть относительным показателем изменчивости. В случае если V20%, то изменчивость большая.

Применение коэффициента вариации V как показателя колеблемости (вариации) имеет суть лишь при хороших значениях вариант и совсем не применимо, в случае если варианты принимают как хорошие так и отрицательные значения.

Рассмотренные числовые характеристики нужно сопоставлять с вариационным рядом, его графическим изображением и трактовать с учетом содержания и единиц измерения, указанных в условиях задачи.

Этап VI. Проверка догадки о обычном законе распределения

Проверка догадки о обычном законе распределения изучаемой случайной величины относится к задачам первичной обработки эмпирических данных. Она серьёзна как для обоснованного применения способов математической статистики, так и как независимый способ. Зная, что эмпирическое распределение, есть обычным, возможно наблюдение заменить расчетом, распознать, не хорошо обозримые по умелым данным, тенденции и свойства трансформации изучаемой случайной величины.

Сущность проверки статистической догадки о обычном законе распределения (как, но и любого другого) пребывает в сравнении информации о случайной величине, взятых эмпирическим методом и теоретическим, которая производится посредством некоей критериальной величины.

Пускай известно эмпирическое распределение частот показателя X.

Тогда, теоретическое распределение вычисляется в предположении, что изучаемая случайная величина подчиняется обычному закону распределения с параметрами , и имеет форму

В случае если дан интервальный вариационный последовательность, то вычисляется по формуле:

При дискретного вариационного последовательности:

, где .

Учитывая, что величина промежутков группировки вариационного последовательности, в большинстве случаев, постоянна и равна h, то

.

Значение находится по таблице с заглавием «Таблица значений функции », а значение по таблице с заглавием «Таблица значений функции ».

В случае если догадка о обычном законе верна, то расхождение между эмпирическими и теоретическими разрешёнными должны расцениваться как случайное, а сходство как неслучайное.

Для характеристики степени расхождения (либо сходства) вводят особую меру, критериальную величину U . Она возможно выбрана разными методами. К примеру, в качестве U возможно забрать сумму квадратов отклонений теоретических возможностей от эмпирических с учетом весовых коэффициентов, либо же большое отклонение эмпирической функции распределения от теоретической F(х).

Разумеется, что величина U зависит от результатов наблюдений, от их закона и числа распределения, следовательно, сама есть величиной случайной, подчиняющейся некоему собственному закону распределения. Данный закон, в большинстве случаев, прекрасно изучен, выведена функция плотности распределения, составлены таблицы значений U.

Итак, значение меры U возможно отыскать по формуле на базе эмпирических данных вариационного последовательности (U замечаемое) и по особой таблице (U табличное).

В случае если догадка о выбранном законе распределения верна, то значение меры расхождения, вычисленной на базе умелых данных (Uнабл) не должно быть больше вероятного ее теоретического значения (Uтабл.), другими словами Uнабл. ? Uтабл.,либо, что также самое: в случае если возможность события P(Uнабл.?U табл.) — громадна, то догадка о предполагаемом обычном законе распределения принимается на определенном уровне значимости , в другом случае догадка отвергается, считается, что эмпирические эти не хорошо согласуются с теоретическими.

Напомним, что факт принятия догадки ни за что не имеет возможности принимать во внимание доказательством её справедливости. Он показывает только на то, что догадка не противоречит умелым данным. Подобно, факт не принятия догадки, не опровергает её, а говорит только об её несогласованности с имеющимся комплектом умелых данных.

Самый распространенные параметры согласия: критерий согласия Пирсона, Романовского, Ястремского, Колмогорова.

Критерий согласия Пирсона.

В качестве меры расхождения между теоретическим и эмпирическим распределениями принимается величина «хи-квадрат»:

где — эмпирическая частота; — теоретическая частота.

В соответствии с закону распределения величины составлена таблица «Критические точки распределения », либо называющиеся «Значение в зависимости k, ».

Из таблицы по известным k и находят и сравнивают его с , вычисленным по указанной формуле с учетом эмпирических данных.

В случае если ( , k), то догадка о обычном законе принимается на уровне значимости , иначе говоря имеется основания вычислять, что эмпирические и теоретические частоты различаются незначимо, различия случайны. В другом случае догадка отвергается на выбранном уровне значимости.

В случае если по таблице обнаружить не ( , k), а возможность, с которой принимается значение случайной величины равное при известном числе степеней свободы k, т.е. обнаружить возможность Р( ), то вывод о догадке зависит от величины данной возможности.

В случае если Р, отысканное по известным и k существенно отличается от 0, фактически больше 0.1, то догадка принимается, а в противном случае — отвергается.

Для этого метода существует таблица «Значение возможностей для критерия ».

Критерий согласия Романовского

В качестве меры близости эмпирического и теоретического распределений В.И.Романовский внес предложение применять величину , но с учетом числа степеней свободы k, другими словами, он внес предложение вычислять величину

,

где k — число степеней свободы.

В случае если , то это дает основание для принятия догадки, в другом случае, в то время, когда , расхождения между эмпирическим и теоретическим распределениями считаются значительными и догадка о обычном законе не принимается.

Критерий согласия Ястремского

В качестве меры близости эмпирического и теоретического распределений, Б.С. Ястремский внес предложение применять величину , но с учетом числа группировок, другими словами

где s – количество групп выборки;

Q – величина, зависящая от количества групп, но при числе групп, меньшем 20, она принимается равной 0,6.

В случае если на данный момент ,то эмпирическое распределение не укладывается в теоретическое и догадка отвергается.

Критерий согласия Колмогорова

В качестве меры расхождения между теоретическим и эмпирическим распределениями А.Н.Колмогоровым предложена величина D — большое значение модуля разности между эмпирической функцией распределения и соответствующей теоретической функцией распределения F(x), другими словами

D = max |F*(x) — F(x)|.

Либо, в случае если вместо функций распределения применять накопленные частоты, то

D = max |N – N/|

где N — накопленная эмпирическая частота;

N’ — накопленная теоретическая частота.

В качестве критериальной величины употребляется , где

D = max |N — N’|.

Величина ? случайная, значения Р(?) затабулированы. Таблица имеет наименование: «Значение функции ». По таблице на базе вычисленного ? находят Р(?). В случае если Р(?) относительно громадно, фактически больше 0.05, то догадка принимается. В случае если Р(?) мало, фактически меньше 0.05, то догадку направляться отвергнуть, как малоправдоподобную.

Действия критерия основаны на том, что большое расхождение (теоретическое) должно быть больше, либо, в крайнем случае, равняется практически замечаемому, другими словами возможность должна быть хорошей от нуля.

Замечание. Критерий Колмогорова используется лишь в том случае, в то время, когда параметры предполагаемого закона распределения известны, если они находятся из умелых данных, то критерий дает заведомо завышенное значение Р(?).

Приближенная проверка

В практике довольно часто употребляется приближенная проверка на нормальность, в базе которой лежат более простые советы, применяющие значения числовых свойства и характеристик обычного закона распределения.

Разглядим приближенную диагностику с применением .

Как мы знаем, что в случае если случайная величина подчиняется обычному закону распределения, то её значения удовлетворяют следующим условиям:

— промежуток содержит приблизительно часть, либо 25% всей совокупности значений;

— промежуток содержит приблизительно часть, либо 50%;

— промежуток содержит приблизительно часть, либо 75%;

— промежуток содержит приблизительно 1, либо 100%.

В случае если эти соотношения выполняются для данной эмпирической совок

53 Проверка догадок


Также читать:

Понравилась статья? Поделиться с друзьями: