Анализ первичных статистик

Для определения способов самая-статистической обработки, в первую очередь, нужно оценить темперамент распределения по всем применяемым параметрам. Для параметров, имеющих обычное распределение либо близкое к обычному, возможно применять способы параметрической статистики, каковые во многих случаях являются более замечательными, чем способы непараметрической статистики. Преимуществом последних есть то, что они разрешают контролировать статистические догадки независимо от формы распределения.

Одним из наиболее значимых в математической статистике есть понятие обычного распределения. Обычное распределение — модель варьирования некоей случайной величины, значения которой определяются множеством одновременно действующих свободных факторов. Число таких факторов громадно, а эффект влияния каждого из них в отдельности мал. Таковой темперамент взаимовлияний очень характерен для психологических явлений, исходя из этого исследователь в области психологии значительно чаще выявляет обычное распределение. Но так бывает не всегда, исходя из этого в каждом случае форма распределения должна быть проверена.

Наиболее значимыми первичными статистиками являются:

а) средняя арифметическая— это величина, сумма отрицательных и хороших отклонений от которой равна нулю. В статистике ее обозначают буквой M либо x. Дабы ее подсчитать, нужно суммировать все значения последовательности и поделить сумму на количество суммированных значений. В случае если в последовательности имеется числа со знаком “минус”, то суммирование создают с учетом знаков.

б) среднее квадратичное отклонение(обозначаемое греческой буквой s (сигма) и именуемое кроме этого главным, либо стандартным, отклонением) — мера разнообразия входящих в группу объектов; она показывает, на какое количество в среднем отклоняется любая варианта (конкретное значение оцениваемого параметра) от средней арифметической. Чем посильнее разбросаны варианты довольно средней, тем громадным оказывается и среднее квадратичное отклонение. Разброс значений характеризует и размах — разность между громаднейшим и мельчайшим значением в последовательности. Но сигма полнее характеризует разброс значений довольно средней арифметической.

в) коэффициент вариации- частное от деления сигмы на среднюю арифметическую, умноженное на 100%. Обозначается CV:

s

CV = — 100%

M

Сигма — величина именованная и зависит не только от степени варьирования, но и от единиц измерения. Исходя из этого по сигме возможно сравнивать изменчивость только одних и тех же показателей, а сопоставлять сигмы различных показателей по полной величине запрещено. Чтобы сравнить по уровню изменчивости показатели любой размерности (выраженные в разных единицах измерения) и избежать влияния масштаба измерений средней арифметической на величину сигмы, используют коэффициент вариации, что представляет собой по существу приведение к однообразному масштабу величины s .

Для обычного распределения известны правильные количественные зависимости значений и частот, разрешающие прогнозировать появление новых вариант: 1) слева и справа от средней арифметической лежит 50% вариант; 2) в промежутке от M-1s до M+1s — 68.7% вариант; 3) в промежутке от M-1.96s до M+1.96s — 95% вариант.

Так, ориентируясь на эти характеристики обычного распределения, возможно оценить степень близости к нему разглядываемого распределения.

Следующими по важности являются такие первичные статистики, как эксцесс и коэффициент асимметрии. Коэффициент асимметрии- показатель скошенности распределения в левую либо правую сторону по оси абсцисс. В случае если правая ветвь кривой дольше левой — говорят о хорошей асимметрии, в противоположном случае — об отрицательной. Эксцесс показатель островершинности. Кривые, более высокие в собственной средней части — островершинные, именуются эксцессивными, у них большая величина эксцесса. При уменьшении величины эксцесса кривая делается все более плоской, получая вид плато, а после этого и седловины — с прогибом в средней части.

Эти параметры разрешают составить первое приближенное представление о характере распределения: у обычного распределения редко возможно найти коэффициент асимметрии, близкий к единице и более единицы (-1 и +1).

Выделю, что это лишь приблизительная оценка. Правильную и строгую оценку нормальности распределения возможно взять применяя один из существующих способов проверки (см. к примеру книги 2 и 5 главы Г.В.Суходольского Базы математической статистики для психологов. Л., 1972.)

Начать с анализа первичных статистик нужно еще и по той причине, что они очень чувствительны к наличию выпадающих вариант. асимметрии и Большие величины эксцесса довольно часто являются индикатором неточностей при подсчетах вручную либо неточностей при введении данных через клавиатуру для компьютерной обработки. Неотёсанные промахи при введении данных в обработку возможно найти, в случае если сравнить величины сигм у подобных параметров. Выделяющаяся величиной сигма может говорить о ошибках.

Существует правило, в соответствии с которому все расчеты вручную должны быть выполнены два раза (очень важные — трижды), причем нужно различными методами, с вариацией последовательности обращения к числовому массиву.

По части ни при каких обстоятельствах не удается всецело охарактеризовать целое, постоянно остаётся возможность того, что оценка главной совокупности на базе выборочных данных не хватает правильна, имеет некую громадную либо меньшую неточность. Такие неточности, воображающие собой неточности обобщения, экстраполяции, которые связаны с перенесением результатов, взятых при изучении выборки, на всю главную совокупность, именуются неточностями репрезентативности. Репрезентативность — степень соответствия выборочных показателей главным параметрам.

Статистические неточности репрезентативности показывают, в каких пределах смогут отклоняться от параметров главной совокупности (от математического ожидания либо подлинных значений) отечественные частные определения, полученные на базе конкретных выборок. Разумеется, величина неточности тем больше, чем больше варьирование показателя и чем меньше выборка. Это и отражено в формулах для вычисления статистических неточностей, характеризующих варьирование выборочных показателей около их главных параметров.

В число первичных статистик входит статистическая неточность средней арифметической. Формула для ее вычисления такова:

s

m = ± —— ,

n

где m — неточность средней, s — сигма, n — число значений показателя. Это главные первичные статистики, каковые разрешают оценить темперамент распределения данных в экспериментальном массиве.

ОПИСАТЕЛЬНАЯ статистика | АНАЛИЗ ДАННЫХ #3


Также читать:

Понравилась статья? Поделиться с друзьями: