![]() |
Трансформация данных в R и графы
1. Трансформация данных
Возник вопрос: как преобразовать данные в R на манер сводных таблиц Excel. Вопрос был решен, но в процессе открыты для себя два полезных пакета, о которых хотелось бы рассказать. Пакет reshape2 - позволяет агрегировать данные на манер Excel. На сайте http://www.r-statistics.com/tag/aggregate/ есть неплохой разбор его возможностей. Основная идея должна быть понятна вот из этой схемы (кликабельна). http://www.r-statistics.com/wp-conte...st-300x214.png Второй пакет -- sqldf. Позволяет писать прямо в коде SQL запросы к данным в синтаксисе SQLite. Привожу простой код, который решает одну и ту же задачу с использованием двух этих пакетов. Имеются данные по весу кошачьих сердец, кошачьих тушек и пола (Пакет MASS данные cats), Попробуем найти для каждого пола число измерений и средний вес тушки. Напишем тестовый пример, который бы в цикле 1000 раз пытался решить эту задачу и посчитаем затраченное время. Возможное решение. Код:
> library(MASS) Во втором примере также показано объединение двух таблиц по ключевому полю с использованием команды merge, поскольку команда cast не позволяет агрегировать сразу по двум функциям (может и позволяет, но я не умею). Такие дела (с). 2. Графы в GNU R Рассматривая интересные библиотеки в R можно упомянуть о возможности строить графы с помощью библиотеки igraph. Простой пример кода. Пытаемся построить граф связей на портале аспирантов (фрагмент). Код:
library(graph) http://www.aspirantura.spb.ru/forum/...pictureid=1100 Нужно или нет, решать вам, но если надо рисовать серьезные графы, то рекомендую сперва глянуть в сторону graphviz. Очень кошерная и мощная штука. |
Вышла книга. Шитиков В.К., Розенберг Г.С. Рандомизация и бутстреп: статистический анализ в биологии и экологии с использованием R. - Тольятти: «Кассандра», 2013. - 289 с.
Ссылка ведет на Интернет-версию на сайте авторов. |
Цитата:
Цитата:
Код:
FileList<-dir("Data_R",pattern = "*.txt", full.names = TRUE, ignore.case = TRUE, include.dirs =TRUE) Цитата:
Добавлено через 36 минут С другой стороны, данных много, поэтому возможно удобнее будет загнать в базу данных SQLite (см. выше о работе в R) и использовать срезы оттуда. Модифицируем чуть-чуть вышеприведенный код Цитата:
http://aspirantura.spb.ru/forum/pict...pictureid=1162 Добавлено через 49 минут Цитата:
Код:
set.seed(666) |
Hogfather,
а в R можно оценивать GARCH модели с разными распределениями ошибок? а оценивать Stochastic volatility models с разными распределениями? Или самим код надо писать? ЗЫ. А что-то типа фильтра Калмана там есть? |
Цитата:
Пример из книжки, упомянутой ниже Код:
library(fGarch) Рекомендую почитать книжку Statistics and Data Analysis for Financial Engineering. Я купил и мои волосы теперь чистые и шелковистые. Цитата:
Цитата:
http://cran.r-project.org/web/packages/FKF/index.html Статья по теме http://www.jstatsoft.org/v39/i02/paper |
Hogfather,
просто огромное спасибо!!!!!!! :jump: :jump: :jump: пошла изучать |
Приобрел неплохую книжку по Data Mining в GNU R, рекомендую.
http://ecx.images-amazon.com/images/...SH20_OU01_.jpg Пакет rattle предназначен для поиска закономерностях в данных (Data Mining) с помощью регрессионных деревьев, кластерного анализа и метода опорных векторов. В книжке разбирается порядок действий от загрузки данных до интерпретации результатов. Код:
library(rattle) К сожалению, работает не все. UPD: Появилось сообщение на форуме поддержки. На настоящий момент решение это проблемы выглядит вот так [1] . Вложение со старой функцией удалено, чтобы не смущало. Цитата:
Т.е. есть еще некоторые проблемки с продуктом,а так, в целом, здорово! |
UPD: Под МакОс rattle категорически отказался работать. Проблемы с GTK+
|
Давненько не брал я в руки шашек. Вот тут задачку придумали, на самом деле весьма интересную с практической точки зрения.
Цитата:
|
Цитата:
Цитата:
Пусть T - дискретная случайная величина, равная количеству набранных баллов (0...90). Функция вероятности случайной величины T: f(t) = P(T=t) Функция распределения случайной величины T: F(t) = P(T<=t) Решение в математической среде Waterloo Maple 15.0. http://4put.ru/pictures/max/772/2372608.jpg |
Текущее время: 09:47. Часовой пояс GMT +3. |
Powered by vBulletin® Version 3.8.8
Copyright ©2000 - 2025, vBulletin Solutions, Inc. Перевод: zCarot
© 2001—2025, «Аспирантура. Портал аспирантов»