Показать сообщение отдельно
Старый 16.11.2012, 15:33   #377
Hogfather
Platinum Member
 
Аватар для Hogfather
 
Регистрация: 22.07.2010
Адрес: Санкт-Петербург
Сообщений: 3,304
По умолчанию

Цитата:
Сообщение от Ink Посмотреть сообщение
+1. Отец! Переведи на наш!
Попробую.
Есть некая организация А, в которой в 20ХХ году средняя зарплата была 19660 рублей. Хорошо это или плохо?
Подробнее

А тут нам говорят, что есть еще медиана 15000
Мы радуемся и говорим, что тогда наше распределение, наверное, логнормальное, а давайте прикинем что мы имеем.
Мю=LN(15000), т.е. 9,6158
А Сигма = 0,7356 (решите уравнение, прологарифмировав обе части)
Тогда можем прикинуть квартили и процентили
Код:
> qlnorm(0.25,9.61580548,0.735575847)
[1] 9133.161
>  qlnorm(0.5,9.61580548,0.735575847)
[1] 15000
> qlnorm(0.75,9.61580548,0.735575847)
[1] 24635.5
> qlnorm(0.9973,9.61580548,0.735575847)
[1] 116109.4
первый квартиль 9133
второй квартиль 24636
Зарплата гендира около 116 тыс. рублей.

А на самом деле

Код:
> summary(xx)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  10000   12120   15000   19660   20000   90000
Обратите внимание, что у мы ошиблись в оценке грубо говоря на 20%.
Попытка подгонки распределения под фактические данные даёт
Код:
> mdl<-fitdist(xx$V1,"lnorm")
> summary(mdl)
Fitting of the distribution ' lnorm ' by maximum likelihood 
Parameters : 
         estimate Std. Error
meanlog 9.7537847 0.05203249
sdlog   0.4595385 0.03679174
Loglikelihood:  -810.8249   AIC:  1625.65   BIC:  1630.363 
Correlation matrix:
        meanlog sdlog
meanlog       1     0
sdlog         0     1
Т.е. , в данном случае, мы сильно завысили дисперсию, попытавшись работать только со средним и медианой.
Если бы мы знали квартили, ошибка была бы не такая большая. Но и так неплохо вышло

Вот такая фигня, малята!

---------
DNF is not an option
Hogfather вне форума   Ответить с цитированием
Реклама