Цитата:
Сообщение от Hogfather
(Сообщение 329832)
Степан Капуста, ну, а теперь что я имел ввиду.
Пусть мы исследуем качество приготовления борща и ставим оценки: фигово и зашибись
В таком случае, минимальный размер выборки равен
http://www.texify.com/img/%5CLARGE%5...0%281-p%29.gif
где n - размер выборки
p - предполагаемая доля прямого признака (матожидание)
h - требуемая точность
Примечание 1: 95% доверительный интервал и выборка более 30, иначе не 1.96
Пример 1: Пусть точность равна +-0.1, а p=0.5 тогда минимальный размер выборки равен 96.04
Коню понятно, что зная размер выборки можно оценить точность
http://www.texify.com/img/%5CLARGE%5...%7Bn%7D%7D.gif
Но мы не об этом. Берем и делаем шкалу от 1 до 7 и спрашиваем про наш борщ, насколько он воспринимается потребителем как офигенный
Тогда размер минимальный размер выборки считается по формуле
http://www.texify.com/img/%5CLARGE%5...%7D%29%5E2.gif
где S - стандартное отклонение выборки. Умные книжки говорят, что в данном случае нужно не выпендриваться, а для подсчета СКО делить размах на 5 (именно на 5, а не 6). Ну а точность рекомендуют брать как размах деленный на 10.
n=(1.96*(6/5)/0.6)^2=15,37
Иными словами, чем больше градаций шкалы, тем лучше.
Это на пальцах.
Ну, еще приличные люди используют потом медиану и IQR, потому как так гораздо кошернее. Но это совсем другая история.
|
Не совсем. Первый случай — все правильно. Во втором: ты предлагаешь и утверждаешь, что оценивший борщ на «7» получил удовольствия ровно в 1,1667 раза больше, чем тот, кто оценил на «6»? Это же не так, у каждого своя линейка. В качестве примера: приходит раздолбай к тебе на экзамен, молчит по-партизански и получает «2». Потом приходит отличник и получает «5». Отличник знает ровно в 2,5 раза больше, чем тот, кто вообще не учил?
Эта формула
http://www.texify.com/img/%5CLARGE%5...%7D%29%5E2.gif
будет верна, если мы будем исследовать длину члена у тех, кто попробовал этот борщ. Тогда у того, кто имеет член длиной 7 см., он будет ровно в 7 раз больше, чем член длиной 1 см. А если просто оценки без линейки — тогда см. первую формулу. И еще: член может иметь любую длину: и 7,0 см., и 6,9 см., и 6,5 см. и т. д. Оценка борща — либо «7», либо «6» — т. е. она дискретна, а длина члена — непрерывна.
Теперь о дисперсиях. p(1−p)/n и есть дисперсия доли в совокупности. В формулах для непрервыных признаков эта дисперсия тоже есть. Причем если эти дисперсии неизвестны, то дисперсия доли принимается как ¼, а дисперсия непрерывного признака — как R
2/36 (а СКО — R/6), где R — размах вариации. Это сделано из предпложения, что ошибок выборки, имеющих кратность больше 3, почти не бывает, потому как Ф(t=3)=0,997.
Итого: статистика удовлетворенность борщом и статистика длины членов тех, кто удовлетворялся этим борщом, — вещи немного разные.