Анализ данных

АНАЛИЗ ДАННЫХ - 1. Совокупность действий, осуществляемых исследователем в процессе изучения полученных тем или иным образом данных в целях формирования определенных представлений о характере явления, описываемого этими данными. Исследователь пытается данные «свернуть», сократить их количество, стремясь при этом не потерять полезную информацию, потенциально в них заложенную. Делается это обычно с помощью математических методов.

2. Процесс изучения стат. данных (поиска стат. закономерностей, закономерностей в среднем) с помощью математических методов, не предполагающих вероятностной модели изучаемого явления. Противостоит вероятностно-стат. подходу к обработке данных, опирающемуся на их вероятностную интерпретацию (как случайной выборки из генеральной совокупности) и использование вероятностных моделей для построения и выбора наилучших методов обработки. Получаемые с помощью вероятностно-стат. подхода выводы опираются на строго доказанные математические положения. В частности, этот подход обеспечивает корректный перенос результатов с выборки на генеральную совокупность (см. Оценивание статистическое, Проверка статистических гипотез). В методах А.д. подобные возможности не заложены. Эти методы не удовлетворяют строгим математическим требованиям. Выбор наилучшего метода здесь почти всегда опирается на неформализуемые эвристические соображения. Поэтому проблема обоснования получаемых выводов требует особого внимания. Особенно острой становится необходимость выделения «точек соприкосновения» содержания задачи и математического формализма (см. Адекватность математического метода), реализации в процессе человеко-машинного диалога.

К методам А.д. относят и вероятностно-стат. методы в тех случаях, когда не удается проверить адекватность реальности вероятностной модели, предполагаемой методом.

Выделение методов А.д. обусловлено потребностями ряда наук (в т. ч. социологии), в которых велика потребность поиска стат. закономерностей. Однако предположения, лежащие в основе вероятностно-стат. методов, разработанных специально для решения таких задач, часто не выполняются.

Существует мнение, что поскольку методы А.д. с точки зрения строгой математики не являются достаточно обоснованными, то имеет смысл использовать их лишь на предварительном этапе анализа для уточнения представлений исследователя об изучаемом явлении, корректировки понятийного аппарата, формулировки гипотез и т.д. Однако методы А. д. могут служить и средством получения фундаментального знания, выявления неизвестных ранее закономерностей, если перейти на новый уровень понимания самого математического формализма: считать, что адекватным решаемой задаче является не отдельный метод, а совокупность методов, применяемых в соответствии с определенными методологическими принципами (см. п. 4).

3. Термин, отождествляемый с понятием «прикладная статистика», которая понимается как науч. дисциплина, разрабатывающая и систематизирующая понятия, приемы, математические методы и модели, предназначенные для организации сбора, стандартной записи, систематизации и обработки стат. данных в целях их удобного представления, интерпретации и получения научных и практических выводов.

4. Процедуры поиска стат. закономерностей («свертки» информации), не сводящиеся к применению формальных алгоритмов. В основе лежит комплексное использование математико-статистических методов и методов А.д. (п. 2) с опорой на несколько методологических принципов.

Первый принцип — вариация предпосылок, лежащих в основе выбираемых методов (любой метод опирается на определенную модель изучаемого явления, т.е. определенную систему предпосылок и постулатов): изменение таких предпосылок, рассмотрение последствий этого изменения, сравнение использования разных предпосылок и т.д. Актуальность реализации этого принципа объясняется тем, что для большинства методов проверка состоятельности заложенных в них моделей в социологических задачах является весьма проблематичной.

Второй принцип — системный подход. В процессе А.д. изыскиваются различные приемы для наиб, полного использования и эндогенной информации (т.е. данных, описывающих изучаемый объект), и экзогенной (т.е. данных, описывающих «среду обитания» объекта). Системный подход предъявляет к исследователю повышенные требования, поскольку носит принципиально междисциплинарный характер.

Третий принцип — отказ от той точки зрения, что любое исследование имеет начало и конец. А.д. — способ существования данных. Готовность к постоянному возврату к одним и тем же данным. В непрерывном процессе А.д. предусматриваются разрывы, позволяющие извлекать накопленную информацию и принимать решения, связанные с управлением обработкой данных, с выбором дальнейших шагов А.д. Формальные операции перемежаются с неформальными процедурами принятия решения. С появлением новых данных возникают новые идеи, подходы, методы, уточняется понимание происходящих процессов и т.д. В социологии реализация этого принципа актуальна, т.к. социолог обычно не имеет той априорной модели изучаемого явления, которая является необходимой и для выбора формального аппарата анализа данных и вообще для проведения исследования, начиная с формулировки гипотез и разработки способа сбора данных (см. также Методология применения математических методов).

Ю.Н. Толстова

Литература:

Тьюки Дж.У. Анализ данных, вычисления на ЭВМ и математика // Совр. проблемы математики. М., 1977;

Миркин Б.Г. Анализ качественных признаков и структур. М., 1980;

Елисеева И.И., Рукавишников В.О. Логика прикладного стат. анализа. М., 1982;

Тьюки Дж.У. Анализ рез-тов наблюдений: разведочный анализ. М., 1982;

Айвазян СЛ., Енюков И.С., Мешалкин Л.Д. Прикладная статистика: В 3 т. М., 1983—1989;

Фелингер А.Ф. Стат. алгоритмы в социол. иссл-ях. Новосибирск, 1985;

Толстова Ю.Н. Логика матем. анализа социол. данных. М., 1991;

Татарова Г.Г. Методология анализа данных в соц-и. М., 1998;

Тюрин Ю.Н., Макаров А.А. Стат. анализ данных на компьютере. М., 1998;

Толстова Ю.Н. Анализ социол. данных: методология, дескриптивная статистика; изучение связей между номинальными признаками. М., 2000.

Использованы материалы кн.: Социологический словарь / отв. ред. Г.В. Осипов, Л.Н. Москвичев. М, 2014, с. 17-18.

Понятие: