Язык типологического анализа данных

НИСХОДЯЩАЯ СТРАТЕГИЯ АНАЛИЗА ДАННЫХ

ЯЗЫК АНАЛИЗА ДАННЫХ

Элементы логики анализа. Язык анализа как составная часть языка социологического изучения. Математическая формализация как составная часть логической. Классы математических способов. Логика применения математических способов. Язык типологического анализа. Язык причинного анализа. Язык факторного анализа. Основной и запасные языки анализа. Понятие «метаметодика анализа данных».

Эта глава книги посвящена четвертому и пятому из выделенных нами структурных элементов методики анализа данных, в частности языка анализа и нисходящей стратегии анализа данных. Одна из целей данной главы ¾ завершить обозначение контуров видимой части айсберга называющиеся методика анализа в эмпирической социологии.

В начале третьей главы мы останавливались на том, какой суть вкладывается в понятия восходящая стратегия анализа ¾ нисходящая стратегия анализа. В любом социологическом изучении логическая схема анализа, либо логика анализа, выстраивается опираясь на одну из этих стратегий. Это лишь один штрих процесса формирования логики анализа данных либо, иначе говоря лишь один элемент логической формализации процесса получения знания, которое опирается на эмпирические эти. Второй элемент связан с выбором в изучении как бы главного языка анализа эмпирии. Язык анализа данных есть составной частью языка социологического изучения [1, с. 32—61]. Со своей стороны составной частью любого языка анализа есть математика, математический формализм. Исходя из этого остановимся на самых неспециализированных моментах применения математических способов в социологии.

В начале третьей главы было очень отмечено, что математические способы, приемы, методы анализа данных (обработка, переработка, обобщение, систематизация информации) существуют сами по себе и смогут быть использованы в любой науке, где имеется эмпирия. С некоторыми самыми несложными математическими методами мы познакомились в третьей главе. В рамках восходящей стратегии анализа было проиллюстрировано, как может выстраиваться логика анализа и тем самым логика применения математических способов. Их необходимость естественным образом проистекала из партии от частного к неспециализированному, от поиска несложных эмпирических закономерностей к поиску более сложных. Напомним, что восходящая стратегия анализа появляется при работе с биографиями людей, с текстами полуформализованных и свободных интервью, с данными изучения публичного мнения, т. е. по большей части при работе с информацией второго и пятого типов.

Что входит в математическую формализацию? Говоря легко, где, в то время, когда, как и для чего необходимо применять тот либо другой математический способ? Но эта фраза относится и к «физикам», и к «лирикам». Она не носит оттенка конструктивности для социолога. Социологическая специфика начинается тогда, в то время, когда выстраиваются в изучении ответы на вопросы:

Что изучать? Для чего и с целью достижения каких целей изучать? Где и при каких условиях изучать? Посредством каких средств изучать?

Как уже подчеркивалось в начале книги, эти вопросы смогут быть отнесены как к изучению в целом, так и к раздельно выдроблённым его этапам. Исходя из этого понятие «средства» включает в себя всю совокупность способов социологического изучения, к которым относятся в равной мере:

подходы к изучению социального (способ опроса, качественный способ, количественный способ, биографический способ, анализ социальных совокупностей, моделирование социальных процессов и т. д.);

способы получения информации (анкетирование, интервью, наблюдение, анализ документов);

техники, приемы сбора информации либо способы измерения (способ семантического дифференциала, шкала Терстоуна, шкалограммный анализ Гуттмана и т. д.);

способы матанализа (корреляционный анализ, факторный анализ, латентно-структурный анализ, кластерный анализ и т. д.);

способ как язык анализа (типологический анализ, факторный анализ, причинный анализ, детерминационный анализ, сравнительный анализ и т. д.).

Остановимся на способах, обозначенных в предпоследнем блоке. Любой способ имеет собственную логику применения в социологическом изучении. Как вы уже убедились, без математических способов социологу, трудящемуся с эмпирическими данными, не обойтись [12, 16, 18]. Правильнее говоря, использование не способа, не способов, а класса способов. Класс способов ¾ это способы, использующиеся для ответа приблизительно однообразных задач. Класс способов ¾ это способы, опирающиеся на приблизительно однообразные математические модели. Мы с вами разглядели, по сути, всего два класса способов: способы дескриптивной статистики, либо первичной обработки данных, и способы анализа таблиц сопряженности, либо способы корреляционного анализа. Существует достаточно боль&не;шое количество разных классов способов. Способы дисперсионного анализа, способы регрессионного анализа, способы многомерной классификации, способы факторного анализа, способы многомерного шкалирования, способы причинного анализа, методы детерминационного анализа и т. д. Имеется еще целый пласт, в котором большое количество классов способов. Это пласт так называемых методов математического моделирования. То, что мы перечислили, ¾ это также моделирование, но имеется все же особенные способы, за которыми закрепился термин математическое моделирование [8, 18].

Любой класс математических способов может распадаться на отдельные группы по аналогии с способами анализа таблиц сопряженности. У нас была несколько коэффициентов, основанных на проверке догадки о статистической зависимости, и вторая несколько коэффициентов, основанных на согласованности в ранжировании (коэффициенты ранговой корреляции). Не нужно обращать особое внимание на наименование способа как на указку пути его использования. Это оберегает социолога от приверженности разным способам с прекрасными заглавиями. К примеру, разглядим класс способов, каковые именуются способами причинного анализа. Использование одного из способов этого класса не свидетельствует нахождение подлинной причинности (в случае если таковая по большому счету существует) изучаемых социальных феноменов. Речь заходит только о некоей модели изучения предполагаемых причинно-следственных взаимоотношений между показателями. Сейчас модели такие, а на следующий день совсем другие. И одновременно с этим, отыскав при помощи этих моделей тенденции, синдромы, количественные оценки, социолог приобретает возможность перехода к как следует новому знанию для познания причинности. Но для изучения причинности социолог может применять и другие классы способов, в заглавии которых термин «обстоятельство» отсутствует.

Одинаковый класс способов может употребляться и в контексте измерения, и в контексте реализации определенной логики анализа. Для решения одной и той же содержательной задачи обращение может идти о комплексном применении способов различного класса. Подобная комплексность носит или параллельныйхарактер, или последовательный.Первое свидетельствует использование способов из различного класса для ответа одной и той же задачи. Второе свидетельствует использование способов различного класса на разных стадиях ответа задачи, интересующей исследователя.

Конечно, социолог обязан обладать навыками математической формализации как составной части процесса получения знания, опирающегося на эмпирические эти. Но социологу не столь принципиально важно овладеть математическими способами, сколько мочь связать, увязать воедино процедуры логической и математической формализации. Это и будет составлять в целом логику анализа данных в изучении.

Как же формируется эта логика? И, тем самым, как выбираются в изучении математические способы? Напомню, что с первым составным элементом, разрешающим исследователю создать логику анализа, вы уже познакомились ¾ это выбор одной из стратегий (восходящей либо нисходящей) анализа данных. Соотнесение отдельно забранного социологического изучения с одной из этих двух стратегий анализа зависит от априорных представлений, от априорных знаний социолога об изучаемом фрагменте социальной действительности. По сути, речь заходит о целях, задачах, догадках изучения.

Как мы убедились, в рамках восходящей стратегии, анализа главная неприятность для социолога ¾ выбор способа поиска эмпирических закономерностей и интерпретация этих закономерностей. Формально перед социологом сначала стоит вопрос о выборе класса способов, а лишь позже ¾ о выборе конкретного способа (модели) из этого класса. В случае если задана совокупность шагов по реализации модели, то это именуется методом.

Сперва мы с вами в отечественном модельном изучении, посвященном изучению времяпровождения студентов, искали простенькие эмпирические закономерности, регулярности. Для этого изучали «поведение» раздельно забранного показателя (конкретно замечаемого либо производного от эмпирических индикаторов), т. е. изучали темперамент распределения показателя. Описание распределения происходило на базе вычисления моды, медианы, среднего арифметического, среднего взвешенного, коэффициента количественной вариации, энтропии, коэффициента качественной вариации, дисперсии, квартального размаха.

После этого у нас появилась необходимость поиска более сложных закономерностей, в частности анализа совместного «поведения» двух показателей. Тем самым мы вышли на различное познание парных связей и на математическую формализацию отдельно забранного «понимания». Коэффициентов связи выяснилось большое количество. Было продемонстрировано, что у той части «языка» анализа ¾ языка изучения связи ¾ имеется собственный личный понятийный аппарат, без понимания которого нереально выбрать нужный социологу коэффициент (меру) связи. По сути, мы искали эмпирические закономерности в структуре связей. Чисто технически искали закономерности в таблице сопряженности. Они носили уже более сложный темперамент.

Дальше мы имели возможность перейти к многомерному случаю: как бы к анализу совместного «поведения» многих показателей. Тут язык анализа эмпирических закономерностей претерпел бы дальнейшее усложнение, как, но, и сами эмпирические закономерности. По сути, речь заходит уже о многомерном анализе социальных явлений. Чисто технически ¾ это использование огромного числа разных сложных математических способов, любой из которых опирается на в полной мере определенную математическую модель. Наряду с этим социолог, исходя из восходящей стратегии, последовательно ищет ответы на вопросы, такие, как: не объединяются ли эмпирические индикаторы в факторы, а объекты ¾ в классы. К примеру, похожие в определенном смысле объекты составляют класс, а похожие по «поведению» эмпирические индикаторы смогут образовать «новый социальный» фактор. Основная задача в таких исследовательских сюжетах ¾ неприятность интерпретации приобретаемых эмпирических закономерностей.

Как было отмечено, социолог может строить исследовательский процесс и по нисходящей стратегии. В этом случае концептуальная схема изучения обязана не только существовать, но преддумает достаточно твёрдую структуру, и особенно в той ее части, которая относится к логике анализа. Это предполагает «продумывание» всей логики анализа a priori (до сбора эмпирической информации), выбор как бы главного языка анализа в изучении для поиска ответа на вопрос «Из-за чего это?».

От того, на каком языке анализа социолог будет изучить интересующий его фрагмент социальной действительности, зависит да и то, какого именно рода эмпирический материал ему нужен, да и то, какие конкретно приемы «обработки» информации он будет применять для объяснения и изучения того либо иного социального феномена. Очевидно, выбранная в изучении логика анализа включает в себя как составную часть (либо опирается) на одну из обозначенных Стратегий (восходящая стратегия либо нисходящая стратегия). Но это лишь одна составная часть логики анализа. Вторая составная часть ¾ выбор в изучении языка анализа. К примеру, в качестве таковых смогут выступать язык типологического анализа, язык обстоятельствного анализа, язык факторного анализа.

Разглядим в упрощенном виде их содержательный суть в ситуации, в то время, когда социолог трудится исходно как бы с готовой информацией (первый тип). К примеру, пускай изучаемым социальным явлением будет «феномен господина X на выборах». В то время, когда мы встречаемся с подобным явлением? Или тогда, в то время, когда какой-то неожиэтот кандидат собрал большое число голосов, или, наоборот, узнаваемый кандидат потерпел неудачу. Вот тогда и появляется большое количество клиентов у социолога, каковые желают узнать ответ на вопрос «Из-за чего это?». Независимо от того, кто нам заказал социологический анализ данного феномена, мы должны предложить обоснованную логику анализа. Исходно у нас с вами только результаты выборов, к примеру, число голосов (в процентах), взятых кандидатом в каждой области России. Значит, у нас один-единственный эмпирический индикатор, эмпирические объекты ¾ отдельные области России. Увидим, что отечественный эмпирический индикатор измерен по метрической шкале (шкала процентов). Значениями эмпирического индикатора есть число голосов (в процентах), взятых господином X в каждой области.

Как социолог имел возможность бы выстраивать логику анализа «феномена господина X на выборах»! Такая логика зависит от того, какой язык анализа выбран в качестве главного из обозначенных выше языков анализа. Разглядим кратко, каковыми смогут быть рассуждения социолога при ответе данной задачи, в случае если в качестве главного языка анализа выбраны.

Язык типологического анализа данных

Типологический анализ используется для поиска знания о реально существующих типах (формах, видах) изучаемого социального феномена [10, 14, 20]. Применительно к нашей задаче ¾ это поиск типов существования феномена господина X на выборах.

В первую очередь определяем, какова будет в отечественном исследовании неспециализированная стратегия анализа: восходящая либо нисходящая. Но для этого нужно сформулировать главную цель отечественного исследования. Со своей стороны ее нельзя обозначить без главной догадки изучения. Такая догадка может звучать следующим образом. Существуют группы областей, однотипных в смысле «феномена господина X на выборах», и такие, каковые возможно трактовать как объекты социального управления. Например, в том смысле, что механизм действия на электоральное поведение однообразен в регионах, отнесенных к одной и той же группе, к одному и тому же типу. Тогда цель отечественного исследования ¾ проверка догадки о существовании как раз таких типов областей. Но таких типов может и не быть, т. е. догадка может и не подтвердиться. Из этого, как вы осознаёте, не нужно, что мы взяли нехорошей итог. Для социолога одинаково ответствен любой итог.

Обратите внимание, что в формулировку догадки заложен предполагаемый язык анализа ¾ язык типологического анализа. Что тут первично — догадка либо выбор языка анализа? Ответ на данный вопрос покинем до тех пор пока открытым.

В случае если у нас имеется какие-то априорные представления о существовании как раз для того чтобы рода типов областей, то логика анализа выстраивалась бы по нисходящей стратегии. Тогда мы выделили бы группы однотипных областей по априорно заданным показателям. Эти показатели играют роль типообразующих показателей. После этого изучали бы темперамент распределения отечественного эмпирического индикатора на каждой группе областей, и его связи с другими показателями. Последние кроме этого заблаговременно заданы социологом и также играют роль типообразующих. Пока не представляется вероятным обрисовать всю процедуру типологического анализа. светло одно: в этом случае мы движемся от общего к частному ¾ по нисходящей стратегии.

В случае если же у нас нет никаких априорных представлений, то логика анализа выстраивается по восходящей стратегии. Тогда изучаем темперамент распределения отечественного эмпирического индикатора по всей совокупности областей. Для этого вычисляем размах, моду, медиану, среднее взвешенное, дисперсию, квартильный размах. Допустим, что мы взяли следующие значения:

R1 = 20 ¾ размах, т. е. отличие между большим (пускай оно равняется 25%) и минимальным (пускай оно равняется 5%) значениями эмпирического индикатора;

Мо1 = 10 ¾ первое модальное значение, т. е. чаще всего видятся области, где господин X взял приблизительно 10% голосов;

Мо2 = 20 ¾ второе модальное значение;

Me = 15 ¾ медиана, т. е. в половине областей господин X получил более 15% голосов, а в половине менее 15% голосов;

R2 = 5,5 ¾ квартальный размах, т. е. разброс около медианы, т.е.

= 16,5 ¾ взвешенное среднее арифметическое значение, т. е. в среднем по России господин X взял 16,5% голосов;

s = 7,7 ¾ среднеквадратическое отклонение, т. е. разброс вокруг среднего арифметического равен 7,7.

направляться подчернуть, что мы трудимся с метрической шкалой. Исходя из этого при необходимости построения эмпирической кривой распределения нужно разбить на промежутки (равные либо неравные) целый диапазон трансформации значений (от 5 до 25) эмпирического индикатора.

Исходя из значений размаха, квартального размаха, среднеквадратического отклонения, видим, что совокупность областей неоднородна с позиций электорального поведения. Очевидно, что, как минимум, отмечается четыре типологических синдрома. Первый обусловлен группой областей, давших за господина X предельное количество голосов. Второй ¾ группой областей, давших предельное количество голосов. Наряду с этим такие группы могут складываться из одной единственной области. Третий и четвертый синдромы ¾ группы областей, давших приблизительно 10% голосов и 20% голосов. Это еще не типы, а лишь кандидаты в типы, исходя из этого мы и пользуемся понятием «типологический синдром».

Нас так как интересуют не просто группы областей, похожие по числу, данных господину X голосов. Нам увлекательны лишь такие группы, каковые возможно трактовать как объекты социального управления ¾ в том смысле, что механизм действия на электоральное поведение областей, отнесенных к однотипной группе, однообразен. Исходя из этого появляется вопрос перехода от как бы формальной группировки, совершённой по числу голосов за господина X, к содержательной типологии. А для этого нужна дополнительная информация о отечественных эмпирических объектах ¾ областях. Ответ на вопрос: какая нужна информация ¾ проистекает из поиска социологом ответа на другой вопрос. Чем еще, не считая доли голосов, похожи, близки области, отнесенные к одной и той же группе? Может, в них однообразный процент населения с высшим образованием, быть может, в них однообразная часть сельского населения и т. д. В полной мере вероятен вариант, когда области похожи по тому, как в них организовывалась предвыборная кампания. Вероятно и сочетание нескольких причин и факторов.

Для нас до тех пор пока принципиально важно, что по восходящей стратегии ищутся типологические синдромы, а по нисходящей стратегии проверяются догадки о существовании типов. Языку типологического анализа посвящена следующая ¾ последняя часть книги.

Язык причинного анализа

Содержательный суть языка причинного анализа обусловлен необходимостью поиска причинно-следственных взаимоотношений между социальными феноменами. Наряду с этим следствие и причина раздроблены во времени. Одинаковая обстоятельство может породить некакое количество следствий. Одно да и то же следствие может проистекать из-за существования различных обстоятельств.

Применительно к той же задаче изучения «феномена господина X на выборах» мы можем рассуждать приблизительно так. Мы замечаем следствие (число голосов, данных господину X в каждой области), обстоятельства которого нам малоизвестны и логика анализа которых нам пока остается под вопросом. Как и при типологического анализа, огромную роль при построении логики анализа играются априорныепредставления о причинно-следственных отношениях, догадки изучения. Но они уже сформулированы на втором языке ¾ языке причинного анализа.

В рамках восходящей стратегии анализа возможно изучать причинность методом выделения зависимого и свободных показателей и соответственно применять знакомые вам, направленные коэффициенты связи между отечественным эмпирическим индикатором (зависимый показатель) и множеством вторых черт областей (свободные показатели). В рамках же нисходящей стратегии должны быть заблаговременно заданы качественные модели причинного анализа [3, 5]. Нужно различать причинный анализ как язык анализа в социологических изучениях и обстоятельствный анализ как класс математических способов. Последнее значительно чаще именуют причинными моделями либо моделями обстоятельствного анализа.

В любом случае, изучая обстоятельства того либо иного электорального поведения, нереально обойтись без изучения характера распределения отечественного эмпирического индикатора, по причине того, что одинаковое следствие (однообразное число голосов данных за господина X) возможно порождено, одной и той же обстоятельством, различными обстоятельствами, сочетанием разных обстоятельств. Все эти гипотезы необходимо контролировать. Конечно, база для этого ¾ эмпирическая ее характеристики и кривая распределения. Они вам знакомы.

направляться подчернуть, что изучение причинности может привести к выводу, что существуют типы областей, где однообразны причинно-следственные отношения между электоральным поведением и обстоятельствами, обусловившими его.

Язык факторного анализа

Суть факторного анализа в поиске знания о существовании социальных факторов, растолковывающих, обрисовывающих социальное явление. В случае если обратиться к «феномену господина X на выборах», то логику анализа возможно выстроить и опираясь на поиск факторов, детерминирующих то либо иное электоральное поведение. Финално мы опираемся снова же на темперамент распределения отечественного эмпирического индикатора. Но объяснение такому распределению ищем на языке социальных факторов. Что такое социальный фактор? Как вы понимаете, существует огромное количество определений, что имеется социальный фактор. Но нам на данный момент достаточно понимания лишь одного нюанса, в частности: на эмпирическом уровне социальному фактору соответствует как бы сочетание совокупности эмпирических индикаторов. Этап жизненного цикла человека, образованность, структура потребностей, темперамент предвыборной кампании ¾ вот маленький список факторов, разных по сложности.

Появляется вопрос, какое сочетание эмпирических индикаторов образует социальный фактор. Это сочетание может носить априорно заданный логический темперамент. К примеру, этап жизненного цикла образуется из таких эмпирических индикаторов, как возраст, семейное положение, число детей. Отдельному этапу соответствует сочетание значений этих трех эмпирических индикаторов. Тогда фактор ¾ производный показатель, имеющий в общем случае номинальный уровень измерения.

На эмпирическом уровне фактор возможно осознавать и как группы взаимосвязанных между собой эмпирических индикаторов. Отметим, что с таким пониманием фактора вы сталкивались в книге при рассмотрении способа семантического дифференциала Ч. Осгуда. В случае если связь отмечается, то говорим о наличии факторных синдромов, о факторной структуре всей совокупности замечаемых показателей. Тогда взаимосвязанной группе эмпирических индикаторов возможно поставить в соответствие некоторый индекс, производный показатель, количественно измеренный. Факторный анализ в рамках восходящей стратегии носит равно как и в случаях типологического и причинного анализов, сугубо качественный темперамент. В рамках восходящей стратегии все языки анализа оказывают помощь только сформулировать новые догадки с целью проведения новых изучений. В рамках же нисходящей стратегии факторный анализ разрешает контролировать догадки о существовании факторов в заданном социологом смысле. Наряду с этим под причиной может пониматься, как уже отмечалось, несколько тесно взаимосвязанных между собой эмпирических индикаторов. направляться различать: факторный анализ как класс математических способов выделения взаимосвязанных групп эмпирических индикаторов [4, 13]; факторный анализ как язык анализа социальной действительности.

Для «феномена господина Х на выборах» изучение факторов, воздействующих на электоральное поведение, может привести нас, например, к следующему выводу: существуют группы областей, в которых электоральное поведение одинаково и детерминировано одними и теми же факторами. И в том случае, в то время, когда главный язык анализа ¾ факторный анализ, появляется необходимость в других языках анализа, в частности языка типологического анализа.

Главный язык анализа

Кроме того исходя из для того чтобы упрощенного понимания языков анализа видно, что они пересекаются, употребляются в один момент в раздельно забранном социологическом изучении. Вместе с тем один из них играется как бы заглавную роль, роль главного языка анализа, а остальные запасного роль ¾ по аналогии с понятиями «основная и» вспомогательная «гипотеза » изучения. Эти виды анализа, каковые мы условно для наглядности назвали языками анализа, являются исследовательскими стратегиями анализа данных особенного вида. Чтобы не было путаницы с неспециализированной стратегией (восходящей либо нисходящей), направляться пользоваться термином «методика анализа данных». Огромную роль метаметодики играются по большей части в рамках нисходящей стратегии анализа. Исходя из этого эта глава и имеет соответствующее наименование. Типологический анализ, причинный анализ, факторный анализ возможно трактовать и как классы содержательных задач в социологии, ответ которых проходит по одной и той же логической схеме.

Самым ответственным в понимании этих метаметодик анализа является то, что любая из них имеет собственный личный понятийный аппарат, т. е. совокупность понятий, без которых нереально применить ту либо иную стратегию. Наряду с этим в таковой аппарат входят понятия как экзогенного, так и эндогенного характера. Первые их них являются совершенными конструктами, совершенными, образами и не подлежат эмпирической интерпретации. Они играют роль как бы путеводной звезды в изучении для его структурирования. Вторые, напротив, подлежат эмпирической интерпретации, операционализации. Среди них, со своей стороны, имеется понятия, подлежащие и математической формализации. Социологу такие знания, т. е. знания понятийного аппарата разных языков анализа, нужны для грамотной постановки задач. Использование математических способов вне контекста логики анализа в изучении ведет к печальным последствиям. К примеру, социолог начинает ненавидеть математику, потому что она не дала ему ожидаемого нового знания. Это во-первых. Во-вторых, такие знания приводят социолога к другим пониманию, интерпретации, объяснению социальной действительности. В последней части книги как пример будет рассмотрен понятийный аппарат и логика проведения типологического анализа.

Вы не забывайте, мы разглядывали простенькие модели изучения особенностей социальных объектов для перехода с теоретического уровня на эмпирический. Наряду с этим не затрагивались вопросы обратного перехода, для которого очень принципиально важно понятие главного языка анализа в изучении. Более того, обозначение главного языка анализа и позволяет обоснованного перехода от эмпирического уровня обратно к теоретическому.

Итак, обозначенные выше языки анализа являются исследовательскими стратегиями анализа особенного вида. Все они являются элементами логики анализа. Их возможно обозначить и как метаметодики анализа, разрешающие создавать методики анализа для отдельных исследовательских обстановок, для ответа отдельных содержательных задач. Выбор социологом в ходе планирования изучения конкретной метаметодики позволяет в дальнейшем верно выбрать методы и методы сбора математического анализа эмпирических данных.

1. Анализ данных. Введение в python | Технострим


Также читать:

Понравилась статья? Поделиться с друзьями: