А тут нам говорят, что есть еще медиана 15000
Мы радуемся и говорим, что тогда наше распределение, наверное, логнормальное, а давайте прикинем что мы имеем.
Мю=LN(15000), т.е. 9,6158
А Сигма = 0,7356 (решите уравнение, прологарифмировав обе части)
Тогда можем прикинуть квартили и процентили
Код:
> qlnorm(0.25,9.61580548,0.735575847)
[1] 9133.161
> qlnorm(0.5,9.61580548,0.735575847)
[1] 15000
> qlnorm(0.75,9.61580548,0.735575847)
[1] 24635.5
> qlnorm(0.9973,9.61580548,0.735575847)
[1] 116109.4
первый квартиль 9133
второй квартиль 24636
Зарплата гендира около 116 тыс. рублей.
А на самом деле
Код:
> summary(xx)
Min. 1st Qu. Median Mean 3rd Qu. Max.
10000 12120 15000 19660 20000 90000
Обратите внимание, что у мы ошиблись в оценке грубо говоря на 20%.
Попытка подгонки распределения под фактические данные даёт
Код:
> mdl<-fitdist(xx$V1,"lnorm")
> summary(mdl)
Fitting of the distribution ' lnorm ' by maximum likelihood
Parameters :
estimate Std. Error
meanlog 9.7537847 0.05203249
sdlog 0.4595385 0.03679174
Loglikelihood: -810.8249 AIC: 1625.65 BIC: 1630.363
Correlation matrix:
meanlog sdlog
meanlog 1 0
sdlog 0 1
Т.е. , в данном случае, мы сильно завысили дисперсию, попытавшись работать только со средним и медианой.
Если бы мы знали квартили, ошибка была бы не такая большая. Но и так неплохо вышло
Вот такая фигня, малята!