Поиск взаимодействий
ПОИСК ВЗАИМОДЕЙСТВИЙ - одна из наиболее распространенных задач анализа данных в социологии, состоящая в выявлении взаимодействий признаков. Рассмотрим (в значительной мере условно) несколько групп методов поиска взаимодействий, в значительной мере определяющихся тем, как понимается само взаимодействие.
Прежде всего выделим анализ дисперсионный. Понятие взаимодействия здесь сугубо статистично: мы говорим о его наличии, если отвергается статистическая гипотеза (см. Проверка статистических гипотез) о том, что эффекты взаимодействий в ячейках равны нулю. Другими словами, говорим о наличии взаимодействия «в среднем», без выделения конкретных сочетаний значений признаков — предикторов (X1, ..., Xn), обусловливающих то или иное значение признака-функции Y. Кроме того, дисперсионный анализ, как правило, не применяется в случае, когда количество независимых признаков больше двух (уже при трех аргументах сложность аппарата сильно увеличивается). Преимущество дисперсионного в том, что он, являясь методом проверки статистических гипотез, позволяет говорить о генеральной совокупности.
Ко второй группе отнесем ряд классических методов анализа многомерного статистического. Рассмотрим для примера анализ регрессионный. Этот метод не направлен специально на поиск взаимодействий и даже не всегда позволяет их оценить. Возможность анализа взаимодействий возникает, когда в уравнение регрессии включаются нелинейные члены в виде произведений нескольких переменных. Если коэффициент при каком-то произведении оказывается высоким, это будет означать, что формирующие произведение переменные взаимодействуют. И здесь, как и в случае дисперсионного анализа, мы не можем сказать, какие именно сочетания значений этих предикторов оказывают особенно сильное воздействие на независимую переменную, не можем и проверить статистическую гипотезу о наличии такого взаимодействия. Но в данном случае мы можем дать статистическую оценку коэффициента, стоящего перед упомянутым произведением, т.е., задав вероятность, можем определенно, в каких пределах этот коэффициент с этой вероятностью будет заключен как параметр генеральной совокупности. Если эти пределы будут сравнительно небольшими (при устраивающей нас доверительной вероятности), то возможно будет говорить, что рассматриваемые предикторы все же «в среднем» взаимодействуют.
И наконец, к третьей группе методов отнесем методы, специально направленные на поиск сочетаний значений предикторов, определяющих заданное «поведение» объектов. Это анализ детерминационный, алгоритмы типа AID, методы поиска логических закономерностей.
К.Д. Аргунова, Ю.Н. Толстова
Социологический словарь / отв. ред. Г.В. Осипов, Л.Н. Москвичев. М, 2014, с. 339.