![]() |
Обосновать выбор количества кластеров
Был проведен соц.опрос. Количество респондентов - 700. Количество вопросов (показателей) - 33. Оцениваемая шкала - от 0 до 10. Сначала был проведен факторный анализ для снижения размерности методом главных компонент. На выходе получено 5 факторов. Дальше требуется выполнить кластерный анализ по результатам факторного анализа, т.е. по 5 факторам. Предполагается применение метод k-средних. Но затрудняет вопрос с выбором (и обоснованием этого выбора) количества кластеров. Вычисления проводятся с помощью SPSS 20.
Возможно ли обосновать выбор количества кластеров с помощью псевдо-f статистики (pseudo-F statistics) и критерием кубеческой кластеризации (CCC - cubic clustering criterion) с помощью SPSS 20? И как все-таки обосновать выбор количества кластеров в данном случае? |
Это какая-то ересь
|
Цитата:
|
Цитата:
|
Цитата:
|
Цитата:
|
banitl, гадание на дендрограмме пробовали?
|
Прочитал уйма материалов на счет псевдо-f статистики и критерия кубеческой кластеризации, и во всех этих материалах они использовались в процессе расчетов и только в виде формул. Так как я провожу расчеты с помощью программы SPSS, то там не существует этих критериев. И мне потребовалось хоть какое-то обоснование их использования. Еще и подумал, а может есть другой путь обоснования выбора количества кластеров.
|
Цитата:
|
Цитата:
|
Цитата:
http://www.aspirantura.spb.ru/forum/...pictureid=1112 P.S. Вот Вам забавная статейка, изучайте. |
Цитата:
|
Цитата:
И не почитать ли найденную навскидку литературу для начала? http://tx.shu.edu.tw/~PurpleWoo/Lite...20Analysis.pdf |
Цитата:
Добавлено через 1 минуту Цитата:
|
Цитата:
А при итеративном методе для выбора количества кластеров во многих источниках рекомендуют использование вышеперечисленных критериев. Так как в SPSS не встретил этих критериев, возник данный вопрос. За книгу премного благодарен! Добавлено через 3 минуты Дорогой, Hogfather! Такое умозаключение пришло вот из за этой фразы в конце данного материала: "... Все это затрудняет выбор исследователем оптимального решения. В такой ситуации наилучшим способом утвердиться в том, что найденное кластерное решение является на данном этапе исследования оптимальным, является только согласованность этого решения с выводами, полученными с помощью других методов многомерной статистики. Очевидно, что в этом случае имеет смысл обратиться за помощью к опытному биостатистику. " |
Текущее время: 14:28. Часовой пояс GMT +3. |
Powered by vBulletin® Version 3.8.8
Copyright ©2000 - 2025, vBulletin Solutions, Inc. Перевод: zCarot
© 2001—2025, «Аспирантура. Портал аспирантов»