Портал аспирантов - Показать сообщение отдельно

Hogfather · 16.11.2012, 15:33

Цитата:

Сообщение от Ink

+1. Отец! Переведи на наш!

Попробую.
Есть некая организация А, в которой в 20ХХ году средняя зарплата была 19660 рублей. Хорошо это или плохо?

Подробнее

А тут нам говорят, что есть еще медиана 15000
Мы радуемся и говорим, что тогда наше распределение, наверное, логнормальное, а давайте прикинем что мы имеем.
Мю=LN(15000), т.е. 9,6158
А Сигма = 0,7356 (решите уравнение, прологарифмировав обе части)
Тогда можем прикинуть квартили и процентили

Код:

> qlnorm(0.25,9.61580548,0.735575847)
[1] 9133.161
>  qlnorm(0.5,9.61580548,0.735575847)
[1] 15000
> qlnorm(0.75,9.61580548,0.735575847)
[1] 24635.5
> qlnorm(0.9973,9.61580548,0.735575847)
[1] 116109.4

первый квартиль 9133
второй квартиль 24636
Зарплата гендира около 116 тыс. рублей.

А на самом деле

Код:

> summary(xx)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  10000   12120   15000   19660   20000   90000

Обратите внимание, что у мы ошиблись в оценке грубо говоря на 20%.
Попытка подгонки распределения под фактические данные даёт

Код:

> mdl<-fitdist(xx$V1,"lnorm")
> summary(mdl)
Fitting of the distribution ' lnorm ' by maximum likelihood 
Parameters : 
         estimate Std. Error
meanlog 9.7537847 0.05203249
sdlog   0.4595385 0.03679174
Loglikelihood:  -810.8249   AIC:  1625.65   BIC:  1630.363 
Correlation matrix:
        meanlog sdlog
meanlog       1     0
sdlog         0     1

Т.е. , в данном случае, мы сильно завысили дисперсию, попытавшись работать только со средним и медианой.
Если бы мы знали квартили, ошибка была бы не такая большая. Но и так неплохо вышло

Вот такая фигня, малята!

Реклама