1. Скорее всего, вы сравниваете не одинаковость распределения выборок, а одинаковость средних, поэтому Вам нужен дисперсионный анализ (One way ANOVA в статистических пакетах). Но тогда подразумевается, что данные в выборке распределены нормально. Если данные распределены неизвестно как, то, как вариант, экспресс-тест Тьюки, хотя это и некошерно. Регрессионный анализ, как альтернатива ANOVA, годится, в принципе, он достаточно робастен, но не резиновый. Поэтому выбросы и нормальность распределения я бы посмотрел на графике в любом случае.
2. Разведочный анализ данных, в основном, инструмент быстрой визуализации, чтобы понять, с чем имеешь дело и не заниматься ерундой.
3. Не обязательно проводить всё, особенно если не знаешь зачем. Важно понять что за данные на входе, потому как "мусор на входе - мусор на выходе" (GIGO)
4. Меня смущает "оценка климата". Методически правильно бы сперва еще протестировать систему измерений (MSA). Поскольку подозреваю, что это некая порядковая квалиметрическая шкала, то каппа-статистика в помощь.
Последний раз редактировалось Hogfather; 15.07.2014 в 11:15.
Причина: Опечатки
|