Этапы статистических операций

Любое статистическое изучения складывается из шести этапов.

Этап 1. Статистическое изучение начинается с формирования первичной статистической информационной базы по выбранному комплексу показателей.

Этап 2. группировка и Первичное обобщение статистических данных.

  • Сводки, группировки, гистограммы, полигоны, кумуляты (огивы), графики распределения частот (частостей).
  • Формирование последовательностей динамики и их первичный анализ. Графический прогноз (с концепцией оптимист, пессимист, реалист).
  • Расчет моментов К-го порядка (средних, дисперсий, мер скошенности, измерения эксцесса) с целью определения показателей центра расширения показателей вариации, показателей скошенности (асимметрии), показателей эксцесса (островершинности).
  • первичные расчёты и Формирование сложных статистических показателей (относительных, сводных многоуровневых).
  • первичные расчёты и Формирование индексных показателей.

Этап 3. Следующий этап статистического изучения включает экономическую интерпретацию первичного обобщения.

Этап 4. Компьютерный анализ первичных и обобщенных расширенных (объемных) статистических данных.

Этап 5. Компьютерное прогнозирование по выбранным самые важным направлениям.

Этап 6. Обобщенный анализ взятых результатов и проверка их на достоверность по статистическим параметрам. Этап 7. Завершающим этапом статистического изучения есть принятие управленческого ответа.

70. Одной из задач, каковые стоят перед исследователем при проведении изучения, есть сбор нужных эмпирических информации об объекте изучения. Множество элементов, составляющих объект изучения, именуют главной совокупностью (ГС). самые простым, на первый взгляд, методом сбора данных есть целое обследование ГС. Но использование целого обследования не всегда представляется вероятным. В этом случае используется выборочное обследование. Сущность выборочного способа заключена в том, что обследованию подвергается лишь часть элементов ГС, которая именуется выборочной совокупностью (ВС). Выборочный способ разрешает не только сократить временные и материальные затраты на проведения изучения, но и повысить достоверность результатов изучения. Помимо этого, выборочный способ имеет более широкую область применения. Широта области применения выборочного способа разъясняется тем, что небольшой (если сравнивать с ГС) количество выборки разрешает применять более сложные способы обследования, включая применение разных технических средств (к примеру, видео- и аудиосредства, Интернет и персональные компьютеры, и сложную измерительную технику).

71. База выборки — это описание (список) всех единиц наблюдения исходной совокупности, что употребляется для наблюдения единиц и отбора отбора. Значительно чаще понятие используется к ед. наблюдения.

Базы бывают трех видов:

1. базы, созданные для задач и неисследовательских целей;

2. намерено созданные базы (используются очень редко);

3. готовые базы, дорабатываемые для изучения (натуробход участков для голосования): банки адресов, перечни информации о работниках фирм, базы данных абонентов телефонных сетей, перечни избирателей и т.п.

Базы выборки должны владеть следующими особенностями:

  • полнотой (наличие всех единиц исходной совокупности)
  • точность (отсутствие дублирования и несущ-х единиц)
  • удобство, доступность
  • адекватность в соответствии с задами и целями СИ

Значительно чаще за базу берутся: перечни участков для голосования и избирателей, разные банки адресов, телефонные базы.

72. Неточности регистрации образуются благодаря неправильного установления фактов в ходе наблюдения, либо ошибочной их записи, либо того и другого совместно.

Неточности представительности (репрезентативности) характерны лишь несплошному наблюдению (обследование лишь части единицы совокупности). Отклонение величины изучаемого показателя в отобранной для обследования части совокупности от его величины во всей совокупности, именуются неточностью репрезентативности.

73. С целью проведения социологического изучения не хватает объект изучения. Нерационально опрашивать всех людей, составляющих объект изучения (время от времени это смогут быть тысячи людей). На это уйдет большое количество времени. Исходя из этого в большинстве случаев социологические изучения имеют не сплошной, а выборочный темперамент. Другими словами по определенным и строгим правилам исследователь отбирает маленькое (довольно всего количества выборки) число людей, каковые по своим социально-демографическим показателям и вторым каким-то чертям всецело соответствуют структуре изучаемого объекта. Эта операция носит название «выборка». статистики и Математики вывели формулу для определения количества выборки:

n = сигма в квадрате х на t в квадрате / дельта в квадрате

Где n — количество выборки:
сигма — дисперсия, либо мера рассеивания исследуемого показателя; в главной совокупности (степень однородности исследуемых единиц наблюдения);
t — коэффициент доверия (заданная точность);
дельта — предельная неточность выборки.

74. Предельные теоремы теории возможностей разрешают определять размер случайных неточностей выборки. Различают среднюю (стандартную) и предельную неточность выборки. Под средней (стандартной) неточностью выборки знают расхождение между средней выборочной и главной совокупностей. Предельной неточностью выборки принято вычислять максимальное расхождение, т. е. максимум неточности при заданной возможности ее появления.

В математической теории выборочного способа сравниваются средние чёрта показателей выборочной и главной совокупностей и доказывается, что с повышением количества выборки возможность появления громадных неточностей и пределы максимальной неточности уменьшаются. Чем больше обследуется единиц, тем меньше будет величина расхождений выборочных и главных черт. На основании теоремы, доказанной П. Л. Чебышевым, величину средней (стандартной) неточности повторнойпростой случайной выборки при большом количестве выборки (n) возможно выяснить по формуле:

где — стандартная неточность.

Из данной формулы средней (стандартной) неточности повторной несложной случайной выборки видно, что величина зависит от изменчивости показателя в главной совокупности (чем больше вариация показателя, тем больше неточность выборки) и от количества выборки n чем больше обследуется единиц, тем меньше будет величина расхождений выборочных и главных черт).

75. http://www.ekozona.ru/statistika/1339-tri-vida-stratificirovannoj-vyborki.html

77. Под малой выборкой понимается такое выборочное наблюдение, численность единиц которого не превышает 30.

При оценке результатов малой выборки величина главной дисперсии в расчетах не употребляется. Для определения вероятных пределов неточности пользуются так называемым критерием Стьюдента:

где . – мера случайных колебаний выборочной средней в малой выборке.

Величина ? вычисляется на базе данных выборочного наблюдения:

Предельная неточность малой выборки рассчитывается подобным образом:

Но, в этом случае, возможная оценка зависит не только от величины t, но и от количества выборки. Величина коэффициента доверия t при разных количествах малой выборки представлена в таблице 9.3.

78. При серийной выборке величина неточности выборки зависит не от числа исследуемых единиц, а от числа обследованных серий (s) и от величины межгрупповой дисперсии:

Серийная выборка, в большинстве случаев, проводится как бесповторная, и формула неточности выборки в этом случае имеет форму где — межсерийная дисперсия; s — число отобранных серий; S — число серий в главной совокупности.

79. ДИСПЕРСИОННЫЙ АНАЛИЗ [variance analysis] — раздел математической статистики, посвященный способам обнаружения влияния отдельных факторов на итог опыта (физического, производственного, экономического опыта). Д. а. появился как средство обработки результатов агрономических опытов, благодаря которым выявлялись самые благоприятные условия для сортов сельскохозяйственных культур.

Наряду с этим исходят из положения о том, что существенность фактора в определенных условиях характеризуется его вкладом в дисперсию результата. Британский статистик Р. Фишер, создавший данный способ, выяснил его как “отделение дисперсии, приписываемой одной группе обстоятельств, от дисперсии, приписываемой вторым группам”16.

Анализ производится следующим образом. Сперва собирают совокупность наблюдений по факторному показателю, находят среднее значение результата и дисперсию по каждой группе. После этого определяют неспециализированную дисперсию и вычисляют, какая часть ее зависит от условий, неспециализированных для всех групп, какая — от исследуемого фактора, а какая — от случайных обстоятельств. И наконец, посредством особого критерия определяют, как значительны различия между группами наблюдений и, следовательно, возможно ли вычислять ощутимым влияние тех либо иных факторов.

Д. а. используется в планировании опыта и в ряде областей экономических изучений, где он помогает, например, предварительным этапом к регрессионному анализу статистических данных, потому, что разрешает выделить довольно маленькое (но достаточное для целей изучения) количество параметров регрессии

80. Для этих выборок предполагают, что они имеют различные выборочные средние и однообразные выборочные дисперсии. Исходя из этого нужно ответить на вопрос, оказал ли данный фактор значительное влияние на разброс выборочных средних либо разброс есть следствием случайностей, вызванных маленькими количествами выборок. Вторыми словами в случае если выборки принадлежат одной и той же главной совокупности, то разброс данных между выборками (между группами) должен быть не больше, чем разброс данных в этих выборок (в групп).

81. Пускай – i – элемент ( ) -выборки ( ), где m – число выборок, nk – число данных в -выборке. Тогда – выборочное среднее -выборки определяется по формуле

.

Неспециализированное среднее вычисляется по формуле

, где

Главное тождество дисперсионного анализа имеет следующий вид:

,

где Q1 – сумма квадратов отклонений выборочных средних от общего среднего (сумма квадратов отклонений между группами); Q2 – сумма квадратов отклонений замечаемых значений от выборочной средней (сумма квадратов отклонений в групп); Q – общая сумма квадратов отклонений замечаемых значений от общего среднего .

Расчет этих сумм квадратов отклонений осуществляется по следующим формулам:

В качестве критерия нужно воспользоваться критерием Фишера:

.

В случае если расчетное значение критерия Фишера будет меньше, чем табличное значение – нет оснований вычислять, что свободный фактор влияет на разброс средних значений, в другом случае, свободный фактор оказывает значительное влияние на разброс средних значений (?– уровень значимости, уровень риска, в большинстве случаев для экономических задач ?=0,05).

83. Парные коэффициенты корреляции.Для измерения тесноты связи между двумя из разглядываемых переменных (не учитывая их сотрудничества с другими переменными) используются парные коэффициенты корреляции. Методика расчета таких их интерпретации и коэффициентов подобны линейному коэффициенту корреляции при однофакторной связи.

где — среднее квадратическое отклонение факторного показателя;

— среднее квадратическое отклонение результативного показателя.

84. Суть регрессионного анализа – построение функциональных зависимостей между двумя группами переменных размеров Х1, Х2, … Хр и Y. Наряду с этим речь заходит о влиянии переменных Х (это будут доводы функций) на значения переменной Y (значение функции). Переменные Х мы будем именовать факторами, а Y – откликом.самый простой случай – установление зависимости одного отклика y от одного фактора х. Таковой случай именуется парной (несложной) регрессией.
Парная регрессия – уравнение связи двух переменных у и x:
,
где у – зависимая переменная (результативный показатель);
х – свободная, растолковывающая переменная (показатель-фактор).
Различают линейные и нелинейные регрессии.
Линейная регрессия: .
Нелинейные регрессии делятся на два класса: регрессии, нелинейные довольно включенных в анализ растолковывающих переменных, но линейные по оцениваемым параметрам, и регрессии, нелинейные по оцениваемым параметрам.
85. Отбор факторов в большинстве случаев осуществляется в две стадии:

— отбираются факторы, исходя из сущности неприятности

— на базе матрицы показателей корреляции определяют t-статистики для параметров регрессии.

Коэффициенты интеркорреляции (т.е. корреляции между растолковывающими переменными) разрешают исключать из модели дублирующие факторы. Считается, что две переменные очевидно коллинеарны, т.е. находятся между собой в линейной зависимости, в случае если rxixj³0,7.

Потому, что одним из условий построения уравнения множественной регрессии есть независимость действия факторов, т.е. Rxixj=0, то коллинеарность факторов нарушает это условие. В случае если факторы очевидно коллинеарны, то они дублируют друг друга и один из них рекомендуется исключить из регрессии. Предпочтение наряду с этим отдается тому фактору, что при достаточно тесной связи с результатом имеет мельчайшую тесноту связи с другими факторами.

При рассмотрении экономических процессов значительно чаще приходится обращаться к моделям, содержащим более одного фактора-показателя. Так, направляться включить в модель несколько фактор, а пара, т.е. выстроить уравнение множественной регрессии. Уравнение множественной регрессии имеет форму:

y=f(x1,x2,…,xk)

Несложная функция для построения множественной регрессионной модели – линейная:

y = a + b1x1 + b2на данный момент2 +…+ bkxk +?.

Множественная регрессия обширно употребляется в ответе неприятностей спроса, доходности акций, при изучении функции издержек производства, в экономических расчетах и многих вторых вопросов эконометрики. На данный момент множественная регрессия – один из самый распространенных способов в эконометрике.Главная цель – выстроить модель с солидным числом факторов, выяснив наряду с этим влияние каждого из них в отдельности, и их совокупное действие на моделируемый показатель.

86. Задача регрессионного анализа пребывает в построении модели, разрешающей по значениям свободных показателей приобретать оценки значений зависимой переменной. Регрессионный анализ есть главным средством изучения зависимостей между социально-экономическими переменными. Эту задачу мы разглядим в рамках самой распространенной в статистических пакетах хорошей модели линейной регрессии. Специфика социологических изучений пребывает в том, что частенько нужно изучать и предвещать социальные события. Вторая часть данной главы будет посвящена регрессии, целью которой есть построение моделей, предвещающих возможности событий. Величина именуется неточностью регрессии. Первые математические результаты, которые связаны с регрессионным анализом, сделаны в предположении, что регрессионная неточность распределена нормально с параметрами, неточность для разных объектов считаются свободными. Помимо этого, в данной модели мы разглядываем переменные как неслучайные значения. Такое, на практике, получается, в то время, когда идет деятельный опыт, в котором задают значения (к примеру, прописали заработную плат работнику), а после этого измеряют (оценили, какой стала производительность труда).

В общем виде задача статистики в области изучения связей состоит не только в количественной оценке их наличия, силы и направления связи, но и в определении формы (аналитического выражения) влияния факторных показателей на результативные.

Задачами регрессионного анализа являются выбор типа модели (формы связи), установление степени влияния свободных переменных на зависимую и определение расчётных значений зависимой переменной (функции регрессии). Задача регрессионного анализа пребывает в построении модели, разрешающей по значениям свободных показателей приобретать оценки значений зависимой переменной. Регрессионный анализ есть главным средством изучения зависимостей между социально-экономическими переменными. Эту задачу мы разглядим в рамках самой распространенной в статистических пакетах хорошей модели линейной регрессии.

87. Пускай требуется оценить прогнозное значение признака-результата для заданного значения показателя-фактора .

Прогнозируемое значение показателя-результата с доверительной возможностью равной (1-a) в собственности интервалу прогноза:

где — точечный прогноз;

t — коэффициент доверия, определяемый по таблицам распределения Стьюдента в зависимости от уровня значимости a и числа степеней свободы (n-2);

— средняя неточность прогноза.

Точечный прогноз рассчитывается по линейному уравнению регрессии:

.

Средняя неточность прогноза со своей стороны:

88. Для определения вклада конкретных ценных бумаг в риск прекрасно диверсифицированного портфеля нужно оценить степень рыночного, а не неспециализированного риска каждой из них, а после этого выяснить его чувствительность к рыночным трансформациям. Эту чувствительность именуют ?-коэффициентом.

?-коэффициент является индексом изменчивости доходности данного актива по отношению к изменчивости доходности в среднем на рынке. Сам рынок является портфелем из всех акций, и ?-коэффициент его «средней» акции образовывает 1,0. В случае если ?-коэффициент акций i больше 1,0, то их изменчивость превышает изменчивость рынка. В случае если 0 в 1, то доходность акций изменяется в том же направлении, что и доходность рынка, но в меньшей степени.

89. Среди нелинейных моделей чаще всего употребляется степенная функция , которая приводится к линейному виду логарифмированием:

,

где . Т.е. МНК мы используем для преобразованных данных:

а после этого потенцированием находим искомое уравнение.

Широкое применение степенной функции связано с тем, что параметр в ней имеет четкое экономическое истолкование – он есть коэффициентом эластичности.

Коэффициент эластичности показывает, на какое количество процентов измениться в среднем итог, в случае если фактор изменится на 1%. Формула для расчета коэффициента эластичности имеет форму:

. (1.19)

Так как для остальных функций коэффициент эластичности не есть постоянной величиной, а зависит от соответствующего значения фактора , то в большинстве случаев рассчитывается средний коэффициент эластичности:

. (1.20)

90. В регрессионном анализе изучается односторонняя зависимость переменной Y от одной либо нескольких переменных Х1 …., Хk. Главная задача регрессионного анализа – установление формы зависимости между зависимой (Y) и свободными (Х1 …., Хk) переменными и анализ достоверности параметров данной зависимости. Такие переменные, как затраты на рекламу, транспорт, численность населения и т.п. являются свободными переменными, а те переменные, каковые мы пробуем оценить (к примеру, количество продаж), являются зависимыми переменными. Схема составления прогноза содержится в сборе информации о значениях зависимых и свободных переменных, их анализе на предмет наличия связи (корреляция) и выведении математического уравнения, обрисовывающего эту сообщение (регрессия).

Организационные формы статистических наблюдений


Понравилась статья? Поделиться с друзьями: