![]() |
Цитата:
Цитата:
Цитата:
Цитата:
|
Цитата:
А также - что реально представлены морфологические и синтаксические классы слов, а части речи - лишь "некое семантическое тождество слов высокой степени абстракции". Хотя этот аспект изучу повнимательнее и НР потрясу на эту тему покапитальнее. Цитата:
Цитата:
Цитата:
Цитата:
|
Цитата:
Цитата:
Цитата:
Цитата:
|
Цитата:
Наверняка не спроста и мне и LOVe данный вопрос сразу показался узким местом в вашей работе. Вы должны защититься :) |
Цитата:
Цитата:
Цитата:
Цитата:
|
"Ладно. пора кончать этот бардак. Давайте её закопаем" Итак, коллеги. Товарищ Дмитрий В. получил интересные результаты, стал мучать их в Excel и получил картинки, которые никуда не годятся. Дла начала, у нас распределение явно дискретное, а мы рисуем график как для непрерывного. Зачем точки соединять то? Плюнем на Excel слюною, пусть в нем, товарищи, успешные менеджеры отчеты делают, нам путь в нормальный статистический пакет, поэтому только хардкор, только R. Устанавливаем R, создаем вектор данных. Код:
> LT<-c(rep(1,9),rep(2,267),rep(3,2843),rep(4,5450),rep(5,6564),rep(6,7044),rep(7,7518),rep(8,7071),rep(9,5620),rep(10,4016),rep(11,2545),rep(12,1494),rep(13,854),rep(14,416),rep(15,214),rep(16,122),rep(17,53),rep(18,16),rep(19,7),rep(20,2),21,22) Данные берем с графика, любезно предоставленного нам. Смотрим на результат и радуемся Код:
> summary(LT) Сказано-сделано, строим 4 графика в одном. Код:
> old.par <- par(mfrow=c(2,2)) Что мы, собственно говоря видим. А видим, что распределение у нас вполне милое, да слегка несимметричное, но с кем не бывает. Пытаемся натянуть сову на глобус. Для этого используем подгонку распределения методом максимального правдоподобия (maximum-likelihood estimation, MLE). Метод это весьма кошерен, но связан со сложными вычислениями. К счастью для нас, в R уже всё таки имеется. Достаточно подключить библиотеку MASS. Резвимся по полной Код:
> library(MASS) Неплохим графическим методом оценки качества подгонки распределения является график квантилей (quantile). Квантиль — это такое число, что заданная случайная величина не превышает его лишь с указанной вероятностью. Можно рассматривать квантиль как функцию вероятности Q(p), обратную функции распределения вероятностей. Если мы подогнали правильно, то точки на графике должны лежать рядом с прямой y = x. Строим четыре графика для наших распределений. Код:
> old.par <- par(mfrow=c(2,2)) Кому как, а мне больше нравится старик Пуассон. Попробуем нарисовать график аппроксимирующих распределений. Код:
> plot(ecdf(LT),verticals=T,main="Аппроксимация функции распределения") http://aspirantura.spb.ru/forum/pict...&pictureid=972 Ну, пока хватит. Коню понятно, что здесь никакая не гамма, а обычный Пуассон, причем Лямбда равна среднему числу букв в слове. Ну, теперь сам бог велел провести тест Колмогорова-Смирнова Код:
> ks.test(LT,rpois(0:2200/100,lambda=7.19983886)) Бурные продолжительные аплодисменты. А гамма ваша, кака редкая...
Код:
> ks.test(LT,rgamma(0:2200/100, 7.257622928, 1.008025740)) Согласен на соавторство ;) P.S. Ну, мои маленькие девиантные друзья, если кто хочет поподробнее почитать про подгонку распределений в R, рекомендую на сон грядущий статью "Fitting distributions with R" P.P.S. А список наиболее распространенных распределений можно посмотреть вот тут, в вашей любимой Википедии |
Цитата:
Чистенько, аккуратненько, корректненько. |
Hogfather, выскажу огроменное спасибо и тут.
Вляпалась..., Цитата:
|
Цитата:
|
"Пора кончать этот бардак. Давайте её откопаем" Как говорится. не только методом максимального правдоподобия славен R. Ту же задачу можно попробовать решить нелинейным методом наименьших квадратов. Для этого построим кумулятивную (интегральную) функцию распределения и попробуем подогнать понравившегося нам Пуассона. В общем, сделаем примерно то, что пытался проделать Дмитрий В. в Excel. Код:
> # Понеслась! Код:
> # Расчет адекватности модели Для лямбды можно посчитать доверительный интервал Код:
> confint(mdl) Код:
> plot(residuals(mdl),main="Ошибки модели") |
Текущее время: 23:22. Часовой пояс GMT +3. |
Powered by vBulletin® Version 3.8.8
Copyright ©2000 - 2025, vBulletin Solutions, Inc. Перевод: zCarot
© 2001—2025, «Аспирантура. Портал аспирантов»