Определение статистической оценки. точечные статистические оценки.

Пускай требуется изучить количественный показатель главной совокупности. Допустим, что из теоретических мыслей удалось установить, какое как раз распределение имеет показатель. Появляется задача оценки параметров, которыми определяется это распределение. К примеру, в случае если наперед как мы знаем, что изучаемый показатель распределен в главной совокупности по обычному закону, то нужно оценить среднеквадратическое отклонение и математическое ожидание, т. к. эти два параметра всецело определяют обычное распределение. В случае если имеются основания вычислять, что показатель имеет распределение Пуассона, то нужно оценить параметр , которым это распределение определяется. В большинстве случаев имеются только эти выборки, полученные в следствии наблюдений: , , … , . Через эти сведенья и высказывают оцениваемый параметр. Разглядывая , , … , как значения свободных случайных размеров , , … , , возможно заявить, что отыскать статистическую оценку малоизвестного параметра теоретического распределения — это значит отыскать функцию от замечаемых случайных размеров, которая и дает приближенное значение оцениваемого параметра.

Итак, статистической оценкой малоизвестного параметра теоретического распределения именуют функцию от замечаемых случайных размеров. Статистическая оценка малоизвестного параметра главной совокупности одним числом именуется точечной. Ниже рассматриваются следующие точечные оценки: смещенные и несмещенные, действенные и состоятельные.

Чтобы статистические оценки давали хорошие приближения оцениваемых параметров, они должны удовлетворять определенным требованиям. Укажем эти требования. Пускай имеется статистическая оценка малоизвестного параметра теоретического распределения. Допустим, что по выборке количества отыскана оценка . Повторим опыт, т. е. извлечем их главной совокупности другую выборку того же количества и по ее данным отыщем оценку и т. д. Возьмём числа , , … , , каковые будут разны между собой. Так, оценку возможно разглядывать как случайную величину, а числа , , … , — как ее вероятные значения.

В случае если оценка дает приближенное значение с избытком, тогда отысканное согласно данным выборок число ( ) будет больше подлинного значения . Следовательно, и математическое ожидание (среднее значение) случайной величины будет больше, чем , т. е. . В случае если дает приближенное значение с недочётом, то .

Так, применение статистической оценки, математическое ожидание которой не равняется оцениваемому параметру, привело бы к систематическим неточностям. Исходя из этого необходимо настойчиво попросить, дабы математическое ожидание оценки было равняется оцениваемому параметру. Соблюдение требования ликвидирует систематические неточности.

Несмещенной именуют статистическую оценку , математическое ожидание которой равняется оцениваемому параметру , т. е. .

Смещенной именуют статистическую оценку , математическое ожидание которой не равняется оцениваемому параметру.

Но ошибочно вычислять, что несмещенная оценка постоянно даёт хорошее приближение оцениваемого параметра. Вправду, вероятные значения смогут быть очень сильно рассеяны около собственного среднего значения, т. е. дисперсия величины возможно большой. В этом случае отысканная согласно данным одной выборки оценка, к примеру, , может оказаться очень удаленной от собственного среднего значения , соответственно, и от самого оцениваемого параметра . Приняв в качестве приближенного значения , мы допустили бы громадную неточность. В случае если настойчиво попросить, дабы дисперсия величины была малой, то возможность допустить громадную неточность будет исключена. Исходя из этого к статистической оценке предъявляются требования эффективности.

Действенной именуют статистическую оценку, которая (при заданном количестве выборки ) имеет мельчайшую вероятную дисперсию. При рассмотрении выборок громадного количества к статистическим оценкам предъявляется требование состоятельности.

Состоятельной именуют статистическую оценку, которая при пытается по возможности к оцениваемому параметру. К примеру, в случае если дисперсия несмещенной оценки при пытается к нулю, то такая оценка оказывается и состоятельной.

Разглядим вопрос о том, какие конкретно выборочные характеристики оптимальнее в смысле несмещенности, эффективности и состоятельности оценивают главную стреднюю и дисперсию.

Пускай изучается дискретная главная совокупность довольно количественного показателя. Главной средней именуется среднее арифметическое значений показателя главной совокупности. Она возможно вычислена по формулам либо , где — значения показателя главной совокупности количества , — соответствующие частоты, причем .

Пускай из главной совокупности в следствии свободных наблюдений над количественным показателем извлечена выборка количества со значениями показателя . Выборочной средней именуют среднее арифметическое выборочной совокупности. Она возможно вычислена по формулам либо , где — значения показателя в выброчной совокупности количества , — соответствующие частоты, причем .

В случае если главная средняя малоизвестна и требуется оценить ее согласно данным выборки, то в качестве оценки главной средней принимают выборочную среднюю, которая есть несмещенной и состоятельной оценкой. Из этого следует, что в случае если по нескольким выборкам большого количества из одной и той же главной совокупности будут отысканы выборочные средние, то они будут приближенно равны между собой. В этом состоит свойство устойчивости выборочных средних.

Увидим, что в случае если дисперсии двух совокупностей однообразны, то близость выборочных средних к главным не зависит от отношения количества выборки к количеству главной совокупности. Она зависит от количества выборки: чем количество выборки больше, тем меньше выборочная средняя отличается от главной.

Чтобы охарактеризовать рассеяние значений количественного показателя главной совокупности около собственного среднего значения, вводят сводную чёрта — главную дисперсию. Главной дисперсией именуют среднее арифметическое квадратов отклонений значений показателя главной совокупности от их среднего значения , которая вычисляется по формулам: , либо .

Чтобы охарактеризовать рассеяние наблюденных значений количественного показателя выборки около собственного среднего значения , вводят сводную чёрта — выброрчную дисперсию. Выборочной дисперсией именуют среднее арифметическое квадратов отклонений наблюденных значений показателя от их среднего значения , которая вычисляется по формулам: , либо .

Не считая дисперсии , для чёрта рассеяния значений показателя главной (выборочной) совокупности около собственного среднего значения пользуются сводной чёртом — средним квадратическим отклонением. Главным средним квадратическим отклонением именуют квадратный корень из главной дисперсии: . Выборочным средним квадратическим отклонением именуют квадратный корень из выборочной дисперсии:

Пускай из главной совокупности в следствии свободных наблюдений над количественным показателем извлечена выборка количества . Требуется согласно данным выборки оценить малоизвестную главную дисперсию . В случае если в качестве оценки главной дисперсии принять выборочную дисперсию, то эта оценка будет приводить к систематическим неточностям, давая заниженное значение главной дисперсии. Разъясняется это тем, что выборочная дисперсия есть смещенной оценкой ; иначе говоря математическое ожидание выборочной дисперсии не равняется оцениваемой главной дисперсии, а равняется .

Легко исправить выборочную дисперсию так, дабы ее математическое ожидание было равняется главной дисперсии. Достаточно для этого умножить на дробь . В следствии возьмём исправленную дисперсию, которую в большинстве случаев обозначают через . Исправленная дисперсия будет несмещенной оценкой главной дисперсии: .

2. Интервальные оценки.

Наровне с точечным оцениванием статистическая теория оценивания параметров занимается вопросами интервального оценивания. Задачу интервального оценивания возможно сформулировать следующим образом: согласно данным выборки построить числовой нитервал, довольно которого с заблаговременно выбранной возможностью возможно заявить, что в этого промежутка находится оцениваемый параметр. Интервальное оценивание особенно нужно при малом числе наблюдений, в то время, когда точечная оценка в значительной степени случайна, следовательно, мало надежна.

Доверительным промежутком для параметра именуется таковой промежуток, довольно которого возможно с заблаговременно выбранной возможностью , близкой к единице, утверждать, что он содержит малоизвестное значение параметра , т. е. . Чем меньше для выбранной возможности число , тем правильнее оценка малоизвестного параметра . И напротив, в случае если это число громадно, то оценка, произведенная посредством данного промежутка, мало пригодна для практики. Так как финиши доверительного промежутка зависят от элементов выборки, то значения и смогут изменяться от выборки к выборке. Возможность принято именовать доверительной возможностью (надежностью). В большинстве случаев надежность оценки задается наперед, причем в качестве берут число, близкое к единице. Выбор доверительной возможности не есть математической задачей, а определяется конкретной решаемой проблемой. Чаще всего задают надежность, равную ; ; .

Приведем без вывода доверительный промежуток для главной средней при известном значении среднего квадратического отклонения при условии, что случайная величина (количественный показатель ) распределена нормально:

,

где — наперед заданное число, близкое к единице, а значения функции приведены в приложении 2.

Суть этого соотношения содержится в следующем: с надежностью возможно утверждать, что доверительный промежуток ( ) покрывает малоизвестный параметр , точность оценки равна . Число определяется из равенства , либо . По таблице (приложение2) находят довод , которому соответствует значение функции Лапласа, равное .

Пример 1. Случайная величина имеет обычное распределение с известным средним квадратическим отклонением . Отыскать доверительные промежутки для оценки малоизвестной главной средней по выборочным средним, в случае если количество выборок и задана надежность оценки .

Ответ. Отыщем . Из соотношения возьмём, что . По таблице (приложение 2) находим . Отыщем точность оценки . Доверительные промежутки будут таковы: . К примеру, в случае если , то доверительный промежуток имеет следующие доверительные границы: ; . Так, значения малоизвестного параметра , согласующиеся с данными выборки, удовлетворяют неравенству .

Доверительный промежуток для главной средней обычного распределения показателя при малоизвестном значении среднего квадратического отклонения задается выражением .

Из этого следует, что с надежностью возможно утверждать, что доверительный промежуток покрывает малоизвестный параметр .

Имеются готовые таблицы (приложение 4), пользуясь которыми, по заданным и находят возможность , и обратно, по заданным и возможно отыскать .

Пример 2. Количественный показатель главной совокупности распределен нормально. По выборке количества отыскана выборочная средняя и исправленное среднеквадратическое отклонение . Оценить малоизвестную главную среднюю при помощи доверительного промежутка с надежностью .

Ответ. Отыщем . Пользуясь таблицей (приложение 4) по и находим: . Отыщем доверительные границы:

,

.

Итак, с надежностью малоизвестный параметр заключен в доверительном промежутке .

3. Понятие статистической догадки. Неспециализированная постановка задачи проверки догадок.

Проверка статистических догадок тесно связана с теорией оценивания параметров. В естествознании, технике, экономике довольно часто для выяснения того либо иного случайного факта прибегают к высказыванию догадок, каковые возможно проверить статистически, т. е. опираясь на результаты наблюдений в случайной выборке. Под статистическими догадками подразумеваются такие догадки, каковые относятся либо к виду, либо к отдельным параметрам распределения случайной величины. Так, к примеру, статистической есть догадка о том, что распределение производительности труда рабочих, делающих однообразную работу в однообразных условиях, имеет обычный закон распределения. Статистической будет кроме этого догадка о том, что средние размеры подробностей, создаваемые на однотипных, параллельно трудящихся станках, не различаются между собой.

Статистическая догадка именуется несложной , если она конкретно определяет распределение случайной величины , в другом случае догадка именуется сложной. К примеру, несложной догадкой есть предположение о том, что случайная величина распределена по обычному закону с математическим ожиданием, равным нулю, и дисперсией, равной единице. В случае если высказывается предположение, что случайная величина имеет обычное распределение с дисперсией, равной единице, а математическое ожидание — число из отрезка , то это сложная догадка. Вторым примером cложной догадки есть предположение о том, что постоянная случайная величина с возможностью принимает значение из промежутка , в этом случае распределение случайной величины возможно любым из класса постоянных распределений.

Довольно часто распределение величины известно, и по выборке наблюдений нужно проверить предположения о значении параметров этого распределения. Такие догадки именуются параметрическими.

Контролируемая догадка именуется нулевой догадкой и обозначается . Наровне с догадкой разглядывают одну из других (соперничающих) догадок . К примеру, в случае если проверяется догадка о равенстве параметра некоему заданному значению , т. е. : , то в качестве другой догадки возможно разглядеть одну из следующих догадок: : ; : ; : ; : , где — заданное значение, . Выбор другой гтпотезы определяется конкретной формулировкой задачи.

Правило, по которому принимается ответ принять либо отклонить догадку , именуется критерием . Так как ответ принимается на базе выборки наблюдений случайной величины , нужно выбрать подходящую статистику, именуемую в этом случае статистикой критерия . При проверке несложной параметрической догадки : в качестве статистики критерия выбирают ту же статистику, что и для оценки параметра .

Проверка статистической догадки основывается на принципе, в соответствии с которым маловероятные события считаются неосуществимыми, а события, имеющие громадную возможность, считяются точными. Данный принцип возможно реализовать следующим образом. Перед анализом выборки фиксируется некая малая возможность , именуемая уровнем значимости. Пускай — множество значений статистики , а — такое подмножество, что при условии истинности догадки возможность попадания статистики критерия в равна , т. е. .

Обозначим через выборочное значение статистики , вычисленное по выборке наблюдений. Критерий формулируется следующим образом: отклонить догадку , в случае если ; принять догадку , в случае если . Критерий, основанный на применении заблаговременно заданного уровня значимости, именуют критерием значимости. Множество всех значений статистики критерия , при которых принимается ответ отклонить догадку , именуется критической областью; область именуется областью принятия догадки .

Уровень значимости определяет размер критической области . Положение критической области на множестве значений статистики зависит от формулировки другой догадки . К примеру, в случае если проверяется догадка : , а другая догадка форимулируется как : ( ), то критическая область размещается на правом (левом) “хвосте” распределения статистики , т. е. имеет форму неравенства: ( ), где и — те значения статистики , каковые принимаются с возможностями соответственно и при условии, что верна догадка . В этом случае критерий именуется односторонним, соответственно правосторонним и левосторонним. В случае если другая догадка формулируется как : , то критическая область размещается на обоих “хвостах” распределения , т. е. определяется совокупностью неравенств и ; в этом случае критерий именуется двухсторонним.

Рис. 30

На рис. 30 продемонстрировано размещение критической области для разных других догадок. Тут — плотность распределеиня статистики критерия при условии, что верна догадка , — область принятия догадки, .

Так, проверка параметрической статистической догадки при помощи критерия значимости возможно разбита на следующие этапы:

1) сформулировать контролируемую ( ) и другую ( ) догадки;

2) назначить уровень значимости ;

3) выбрать статистику критерия для проверки догадки ;

4) выяснить выборочное распределение статистики при условии, что верна догадка ;

5) в зависимости от формулировки другой догадки выяснить критическую область одним из неравенств , либо совокупностью неравенств и ;

6) взять выборку наблюдений и вычислить выборочные значения статистики критерия;

7) принять статистическое ответ: в случае если , то оклонить догадку как не согласующуюся с результатами наблюдений; в случае если , то принять догадку , т. е. вычислять, что догадка не противоречит итогам наблюдений.

В большинстве случаев при исполнении п. п. 4 — 7 применяют статистику, квантили которых табулированы: статистику с обычным распределением, статистику Стьюдента, статистику Фишера.

Пример 3. По паспортным данным автомобильного двигателя расход горючего на 100 км пробега образовывает 10 л. В следствии трансформации конструкции двигателя ожидается, что расход горючего уменьшится. Для проверки проводятся опробования 25 случайно отобранных машин с модернизированным двигателем, причем выборочное среднее затрат горючего на 100 км пробега по итогам опробований составило 9,3 л. Предположим, что выборка затрат горючего взята из нормально распределенной главной совокупности с дисперсией и средним . Испольуя критерий значимости, проверить догадку, утверждающую, что изменение конструкции двигателя не оказало влияние на расход горючего.

Ответ. Проверяется догадка о среднем ( ) нормально распределенной главной совокупности. Диагностику догадки совершим по этапам:

1) контролируемая догадка : , другая догадка : ;

2) выберем уровнь значимости ;

3) в качестве статистики критерия используем статистику математического ожидания — выборочное среднее;

4) т. к. выборка взята из нормально распределенной главной совокупности, выборочное среднее кроме этого имеет обычное распределение с дисперсией: . При условии, что верна догадка , математическое ожидание этого распределения равняется . Нормированная статистика имеет обычное распределение;

5) другая догадка : предполагает уменьшение расхода горючего, следовательно, необходимо применять односторонний критерий. Критическая область определяется неравенством . По таблице (см. приложение 5) находим ;

6) выборочное значение нормированной статистики критерия равняется ;

7) статистическое ответ: т. к. выборочное значение статистики критерия в собственности критической области, догадка отклоняется: нужно считать, что изменение конструкции двигателя стало причиной уменьшению расхода горючего. Граница критической области для исходной статистики критерия возможно взята из соотношения , откуда приобретаем, что , т. е. критическая область для статистики определяется неравенстсвом .

Ответ, принимаемое на базе критерия значимости, возможно ошибочным. Пускай выборочное значение статистики критерия попадает в критическую область, и догадка отклоняется в соответствии с критерием. В случае если, однако, догадка верна, то решение неверно. Неточность, совершаемая при отклонении верной догадки , именуется неточностью первого рода. Разумеется, возможность не первого рода равна возможности попадания статистики критерия в критическую область при условии, что верна догадка , т. е. равна уровню значимости :

. (11.1)

Неточность второго рода происходит в том случае, если догадка принимается, но в конечном итоге верна догадка . Возможность неточности второго рода возможно вычислить по формуле

. (11.2)

Пример 4. В условиях примера 3 предположим, что наровне с догадкой : рассматривается другая догадка : . В качестве статистики критерия опять заберём выборочное среднее . Предположим, что критическая область задана следующим неравенством . Отыскать возможности неточностей первого и второго рода для критерия с таковой критической областью.

Ответ. Отыщем возможность неточности первого рода. Статистика критерия при условии, что верна догадка : , имеет обычное распределение с математическим ожиданием, равным , и дисперсией, равной . По формуле (11.1), применяя таблицу приложения 5, находим

.

Это указывает, что принятый критерий классифицирует приблизительно 8% машин, имеющих расход 10 л на 100 км пробега, как машины, имеющие меньший расход горючего. При условии, что верна догадка : , статистика имеет обычное распределение с математическим ожиданием, равным и дисперсией, равной . Возможность неточности второго рода отыщем по формуле (11.2):

.

Следовательно, в соответствии с принятым критерием 13,6% машин, имеющих расход горючего 9 л на 100 км пробега, классифицируются как машины, имеющие расход горючего 10 л.

4. Теоретические и эмпирические частоты. Критерии согласия.

Эмпирические частоты — частоты, полученные в следствии опыта (наблюдения). Теоретические частоты расcчитываются по формулам. Для обычного закона распределения их возможно отыскать следующим образом:

, (11.3)

Лекция 2. Статистики первого типа. Точечные их свойства и оценки


Также читать:

Понравилась статья? Поделиться с друзьями: