Портал аспирантов

Портал аспирантов (http://www.aspirantura.spb.ru/forum/index.php)
-   Диссертация (http://www.aspirantura.spb.ru/forum/forumdisplay.php?f=111)
-   -   Проведение социологического опроса. Кто пробовал? (http://www.aspirantura.spb.ru/forum/showthread.php?t=11188)

Любопытный 30.03.2013 16:30

Цитата:

Сообщение от Степан Капуста (Сообщение 329748)
Любопытный, зато я — маркетолог, имеющий опыт проведения опросов. :-) И я с чистой совестью рекомендую сначала почитать учебник по статистике, от корки до корки, дабы потом не было мучительно больно за прожитые годы.

Вкратце: что вопрос с дихотомическим ответом, что вопрос с выборочным ответом имеют одинаковую ошибку выборки при одинаковой доверительной вероятности. Открытые вопросы потом сводятся к выборочным с соответствующими последствиями.

Основы статистики мне знакомы, и для меня совершенно однозначно понятно, что "вопрос с дихотомическим ответом и вопрос с выборочным ответом имеют одинаковую ошибку выборки при одинаковой доверительной вероятности", поскольку шкалы не имеют никакого отношения к выборке. Речь шла все-таки о точности ответов респондентов, а не о точности самой выборки.
Модераторам: можно поделить тему на ветку помощи по проведению опросов и на ветку, где обсуждается отдельно методика? А не то "зафлудится" топик не тем, чем надо бы :-)

Степан Капуста 30.03.2013 18:14

Hogfather, вкратце:

Есть выборка для изучения дихотомического признака. Это значит, нам нужно найти долю прямого признака (p) и долю обратного (1−p). Задаем параметры выборки: доверительный интервал, дисперсию признака в генеральной совокупности (или берем ее как ¼) и т. д. Считаем.

Теперь делаем выборку для изучения качественного признака. Поскольку качественный — не количественный, то нам нужно найти долю первого признака (p1), второго (p2), третьего (p3), ..., последнего (1−p1−p2−...−...pn-1). Ничего похожего не замечаете? Правильно, временно считаем первый признак прямым, а второй и последующие — обратным. Потом второй считаем прямым, остальные — обратным, и т. д. Таким образом, задача сводится к предыдущей.

Поскольку дисперсия в генеральной совокупности неизвестна, то ее в обоих случаях принимают за ¼.

Hogfather 30.03.2013 20:27

Степан Капуста, ну, а теперь что я имел ввиду.
Пусть мы исследуем качество приготовления борща и ставим оценки: фигово и зашибись
В таком случае, минимальный размер выборки равен

http://www.texify.com/img/%5CLARGE%5...0%281-p%29.gif
где n - размер выборки
p - предполагаемая доля прямого признака (матожидание)
h - требуемая точность
Примечание 1: 95% доверительный интервал и выборка более 30, иначе не 1.96

Пример 1: Пусть точность равна +-0.1, а p=0.5 тогда минимальный размер выборки равен 96.04

Коню понятно, что зная размер выборки можно оценить точность
http://www.texify.com/img/%5CLARGE%5...%7Bn%7D%7D.gif

Но мы не об этом. Берем и делаем шкалу от 1 до 7 и спрашиваем про наш борщ, насколько он воспринимается потребителем как офигенный

Тогда размер минимальный размер выборки считается по формуле
http://www.texify.com/img/%5CLARGE%5...%7D%29%5E2.gif
где S - стандартное отклонение выборки. Умные книжки говорят, что в данном случае нужно не выпендриваться, а для подсчета СКО делить размах на 5 (именно на 5, а не 6). Ну а точность рекомендуют брать как размах деленный на 10.
n=(1.96*(6/5)/0.6)^2=15,37

Иными словами, чем больше градаций шкалы, тем лучше.
Это на пальцах.

Ну, еще приличные люди используют потом медиану и IQR, потому как так гораздо кошернее. Но это совсем другая история.

Lazialle 30.03.2013 20:51

Любопытный, привет. Не могу не ответить, учитывая, сколько раз мне самому здесь помогали.
У меня был своеобразный соц. опрос или анкетирование. Но я, во-первых, не социолог (но, мне кажется, это и не важно в данном случае). Во-вторых, как участники начали "меряться письками" (это я по-доброму пытаюсь пошутить) - я немного потерялся, что надо тебе самому, так как эти формулы для меня, что писмена майя, - но, опираясь на первое сообщение темы, мне кажется, мой опыт будет тебе весьма полезен. Тем более, тебя интересуют технические моменты. Чтобы не отвлекать доблестных мужей от дискуссии, подробности кину тебе в почту личную чуть позднее: комп чего-то забарахлил.

Кстати, касательно количества опрашиваемых. Помню, что читал у нескольких авторитетов, что для корректного понимая общей картины хватает 200 человек выбранной фокус группы (не важно по какому принципу: социальные признаки, возрастные, гендерные или вообще групповой опрос). Количество свыше лишь просто увеличивает количество, оставляя процентное соотношение неизменным. Я, кстати, сам в этом убедился.

апд: Любопытный, отправил в личку описание. Плюс несколько страниц из своей диссертации вставил.

докторенок 31.03.2013 12:18

Любопытный, Я, конечно. не социолог, но мне тоже кажется, что за 1 тысячей опрашиваемых гнаться не стоит. Я для диссертации проводила опрос, у меня было 500 респондентов. А так может Вам больше сосредоточиться на качественных исследованиях, например, обсуждение в фокус-группах, интревьюирование с самими молодыми специалистами и их работодателями?

fazotron 31.03.2013 13:16

Цитата:

Сообщение от Любопытный (Сообщение 329763)
поскольку шкалы не имеют никакого отношения к выборке

Вот это правильно. Нельзя ставнивать коричневое с горячим, нельзя говорить, что применение более высокоразмерной шкалы повышает точность исследования и уменьшает выборку. Конечно, дихотомические вопросы могут ограничивать возможные варианты ответов и ухудшают понимание. Тогда, когда четко ясно, что других вариантов нет - они уместны. Но ведь и шкалы бывают разные и их оценки тоже спорны. Например, критикуется 5-бальная метрическая шкала: варианты ответов сдвигаются подсознательно в положительную сторону, поскольку оценки 1 и 2 у людей, воспитанных в российской школе близки и оценка идет обычно по трем цифрам 3,4,5. Поэтому и предлагают шкалу Лейкерта, которая более равномерно распределяет ответы
Но опять же, это не связано с репрезентативностью выборки.
Согласен с Докторенком, что обычно берут для организации 500 - 700 наблюдений, для региона около 1000. Надо еще учитывать, какая выборка: регулируемая, частично рег. или случайная

Степан Капуста 31.03.2013 17:36

Цитата:

Сообщение от Hogfather (Сообщение 329832)
Степан Капуста, ну, а теперь что я имел ввиду.
Пусть мы исследуем качество приготовления борща и ставим оценки: фигово и зашибись
В таком случае, минимальный размер выборки равен

http://www.texify.com/img/%5CLARGE%5...0%281-p%29.gif
где n - размер выборки
p - предполагаемая доля прямого признака (матожидание)
h - требуемая точность
Примечание 1: 95% доверительный интервал и выборка более 30, иначе не 1.96

Пример 1: Пусть точность равна +-0.1, а p=0.5 тогда минимальный размер выборки равен 96.04

Коню понятно, что зная размер выборки можно оценить точность
http://www.texify.com/img/%5CLARGE%5...%7Bn%7D%7D.gif

Но мы не об этом. Берем и делаем шкалу от 1 до 7 и спрашиваем про наш борщ, насколько он воспринимается потребителем как офигенный

Тогда размер минимальный размер выборки считается по формуле
http://www.texify.com/img/%5CLARGE%5...%7D%29%5E2.gif
где S - стандартное отклонение выборки. Умные книжки говорят, что в данном случае нужно не выпендриваться, а для подсчета СКО делить размах на 5 (именно на 5, а не 6). Ну а точность рекомендуют брать как размах деленный на 10.
n=(1.96*(6/5)/0.6)^2=15,37

Иными словами, чем больше градаций шкалы, тем лучше.
Это на пальцах.

Ну, еще приличные люди используют потом медиану и IQR, потому как так гораздо кошернее. Но это совсем другая история.

Не совсем. Первый случай — все правильно. Во втором: ты предлагаешь и утверждаешь, что оценивший борщ на «7» получил удовольствия ровно в 1,1667 раза больше, чем тот, кто оценил на «6»? Это же не так, у каждого своя линейка. В качестве примера: приходит раздолбай к тебе на экзамен, молчит по-партизански и получает «2». Потом приходит отличник и получает «5». Отличник знает ровно в 2,5 раза больше, чем тот, кто вообще не учил?

Эта формула
http://www.texify.com/img/%5CLARGE%5...%7D%29%5E2.gif
будет верна, если мы будем исследовать длину члена у тех, кто попробовал этот борщ. Тогда у того, кто имеет член длиной 7 см., он будет ровно в 7 раз больше, чем член длиной 1 см. А если просто оценки без линейки — тогда см. первую формулу. И еще: член может иметь любую длину: и 7,0 см., и 6,9 см., и 6,5 см. и т. д. Оценка борща — либо «7», либо «6» — т. е. она дискретна, а длина члена — непрерывна.

Теперь о дисперсиях. p(1−p)/n и есть дисперсия доли в совокупности. В формулах для непрервыных признаков эта дисперсия тоже есть. Причем если эти дисперсии неизвестны, то дисперсия доли принимается как ¼, а дисперсия непрерывного признака — как R2/36 (а СКО — R/6), где R — размах вариации. Это сделано из предпложения, что ошибок выборки, имеющих кратность больше 3, почти не бывает, потому как Ф(t=3)=0,997.

Итого: статистика удовлетворенность борщом и статистика длины членов тех, кто удовлетворялся этим борщом, — вещи немного разные.

Hogfather 31.03.2013 18:26

Цитата:

Сообщение от fazotron (Сообщение 329934)
Поэтому и предлагают шкалу Лейкерта

Дык, это да. Я про сам опрос пока ничего не говорил.

Цитата:

Сообщение от Степан Капуста (Сообщение 329986)
статистика удовлетворенность борщом и статистика длины членов тех, кто удовлетворялся этим борщом, — вещи немного разные.

(добродушно) А я и не смешиваю. Просто если Вы начнете мерить МПХ сантиметром, то тоже получите дискретные данные. Маловероятно, что Вы будете это делать микрометром. Да и тогда они будут дискретными, но с большей частотой дискретизации.
Это раз. А во-вторых, качество борща является характеристикой комплексной, поэтому есть простор для маневров, это не длина, тут дело поинтереснее будет.
В-третьих, не все шкалы линейны.
Где-то так.

Степан Капуста 31.03.2013 18:34

Hogfather, дык длину МПХ можно измерять с точностью до атомов — и это можно считать непрерывным. А нелинейная шкала априори заставляет использовать первую формулу — там же дисперсия будет непонятной, с разными вероятностями отклоенений в большую и меньшую сторону.

Alextiger 31.03.2013 18:46

Степан Капуста, сведение шкалы к дихотомии просто "убивает" целые классы явлений, а значит точность уменшается. Допустим есть мужчины, женщины и инопланетяне среднего рода. Шкала м/ж их просто не заметит :)

Степан Капуста 31.03.2013 19:26

Alextiger, уменьшится точность описания явлений. А точность самой выборки — нет.

Alextiger 31.03.2013 20:04

Цитата:

Сообщение от Степан Капуста (Сообщение 330016)
уменьшится точность описания явлений

так о ней и речь ;)

Добавлено через 2 минуты
Цитата:

Сообщение от fazotron (Сообщение 329934)
Нельзя ставнивать коричневое с горячим

почему это нельзя? :)

Степан Капуста 31.03.2013 20:45

Цитата:

Сообщение от Alextiger (Сообщение 330026)
так о ней и речь ;)

А я говорил о точности выборки в самом начале...

Alextiger 31.03.2013 22:12

Цитата:

Сообщение от Степан Капуста (Сообщение 330034)
А я говорил о точности выборки в самом начале...

а это связано. Толку то от точности, если она явления не ловит? в корзину только :rolleyes:

Добавлено через 41 минуту
Цитата:

Сообщение от Степан Капуста (Сообщение 329986)
утверждаешь, что оценивший борщ на «7» получил удовольствия ровно в 1,1667 раза больше, чем тот, кто оценил на «6»? Это же не так, у каждого своя линейка.

так мы вообще субъективную оценку мерим. А шкала задана с градациями, и респондент сознательно относит себя к тому или иному интервалу. Если не доверяем границе в 1,1667 раза, введем промежуточные градации.

Добавлено через 5 минут
Цитата:

Сообщение от Степан Капуста (Сообщение 329986)
В качестве примера: приходит раздолбай к тебе на экзамен, молчит по-партизански и получает «2». Потом приходит отличник и получает «5». Отличник знает ровно в 2,5 раза больше, чем тот, кто вообще не учил?

"2" это только красивое слово :) на самом деле "неуд", т.е. "0" Если считать "в разы" то отличник бесконечно умнее :laugh:

Степан Капуста 01.04.2013 09:10

Цитата:

Сообщение от Alextiger (Сообщение 330047)
"2" это только красивое слово :) на самом деле "неуд", т.е. "0" Если считать "в разы" то отличник бесконечно умнее :laugh:

Вот поэтому балльные шкалы — качественные априори. Для них в формулу вставляют дисперсию доли, а не самого признака.


Текущее время: 00:44. Часовой пояс GMT +3.

Powered by vBulletin® Version 3.8.8
Copyright ©2000 - 2025, vBulletin Solutions, Inc. Перевод: zCarot
© 2001—2025, «Аспирантура. Портал аспирантов»