Статистика непараметрическая

СТАТИСТИКА НЕПАРАМЕТРИЧЕСКАЯ (непараметрические методы статистики, непараметрика) — часть математической статистики, комплекс методов обработки статистических данных, не требующих, чтобы распределение вероятностей было описано каким-либо непараметрическим законом распределения (например, нормальным). Она опирается на более широкие и менее ограничительные свойства распределения вероятностей: статистическая независимость распределений (ошибок наблюдений), непрерывность этих распределений; часто на ту или иную симметрию распределений и т.д.

Отрицание, содержащееся в названии этого направления, имеет исторические корни: в прошлом (30-е годы 20 века) оно возникло как альтернатива господствовавшей тогда системе обработки данных, основанной на гауссовском (нормальном) распределении. Совокупность одномерных гауссовских распределений образует двупараметрическое семейство (параметрами, задающими каждое конкретное распределение, является его математическое ожидание (см. Величины средние) и среднее квадратическое отклонение. Но существуют параметрические распределения вероятностей, например, показательное, логнормальное, распределение Парето и т. д. (см. Закон распределения). «Непараметрические» как название для новых методов подчеркивало их универсальную применимость к непрерывным одномерным распределениям.

Первоначально непараметрические методы предназначались для проверки статистических гипотез (см. Проверка статистических гипотез) об одномерных распределениях вероятностей. Наиб, известные непараметрические критерии — это критерии Колмогорова—Смирнова, изобретенные в 1930-х годах, ранговые критерии Уилкоксона и Манна—Уитни 1940— 1950-х годах и коэффициенты ранговой корреляции Спирмена и Кендалла. Они породили целые научные направления.

Позже понятие «непараметрические методы» существенно расширилось. Родился особый раздел математической статистики, называемый робастной статистикой (robust — крепкий, грубый, дюжий), объединяющих разработки в области изучения устойчивости методов по отношению к отступлениям от предположений статистической модели. Было обнаружено, что ранговые статистические критерии можно применять и для оценки неизвестных параметров статистических моделей.

В настоящее время непараметрические методы (в первую очередь, ранговые) образуют систему обработки статистических данных, по своим возможностям не уступающую классическому методу наименьших квадратов (теория которого базируется на гауссовском распределении ошибок). Разработаны методы непараметрических регрессионного и дискриминантного анализа, непараметрической оценки плотности и т.д. Достоинством непараметрических методов является широта их применимости, устойчивость статистических выводов относительно грубых ошибок, неточностей модели и т.д., математическая простота большей части статистических правил.

Приложения непараметрических методов все чаще появляются в экономических и социально-политических зарубежных и отечественных журналах, чрезвычайно распространены в экспериментальной и социальной психологии, а через них — в маркетинге, социологии, теории надежности, в политических исследованиях, в планировании, изучении рисков, анализе категоризированных (классифицированных) данных.

Ю. Н. Тюрин, Д. С. Шмерлинг

Социологический словарь / отв. ред. Г.В. Осипов, Л.Н. Москвичев. М, 2014, с. 499-500.

Литература:

Тюрин Ю.Н., Шмерлинг Д.С. Непараметрические методы статистики // Соц-я: Методология, методы, матем. модели. 2004. № 18. С. 154-166; Кобзарь А.И. Прикладная матем. статистика. М., 2006.

Понятие: